Fix nemo feature normalization in test code (#2361)

Fangjun Kuang · GitHub
Commit f1405779cff9ef6bb7c737b9786fb27cb933caf2 f1405779 1 parent 831aff18
scripts/nemo/canary/test_180m_flash.py
scripts/nemo/fast-conformer-hybrid-transducer-ctc/test-onnx-ctc-non-streaming.py
scripts/nemo/fast-conformer-hybrid-transducer-ctc/test-onnx-transducer-non-streaming.py
scripts/nemo/parakeet-tdt-0.6b-v2/test_onnx.py
--- a/scripts/nemo/canary/test_180m_flash.py
查看文件 @f140577
+++ b/scripts/nemo/canary/test_180m_flash.py
查看文件 @f140577
@@ -228,8 +228,8 @@ def main():
     features = compute_features(audio, fbank)
     if model.normalize_type != "":
         assert model.normalize_type == "per_feature", model.normalize_type
-        mean = features.mean(axis=1, keepdims=True)
-        stddev = features.std(axis=1, keepdims=True) + 1e-5
+        mean = features.mean(axis=0, keepdims=True)
+        stddev = features.std(axis=0, keepdims=True) + 1e-5
         features = (features - mean) / stddev
     features = np.expand_dims(features, axis=0)
--- a/scripts/nemo/fast-conformer-hybrid-transducer-ctc/test-onnx-ctc-non-streaming.py
查看文件 @f140577
+++ b/scripts/nemo/fast-conformer-hybrid-transducer-ctc/test-onnx-ctc-non-streaming.py
查看文件 @f140577
@@ -140,8 +140,8 @@ def main():
     if model.normalize_type != "":
         assert model.normalize_type == "per_feature", model.normalize_type
         features = torch.from_numpy(features)
-        mean = features.mean(dim=1, keepdims=True)
-        stddev = features.std(dim=1, keepdims=True) + 1e-5
+        mean = features.mean(dim=0, keepdims=True)
+        stddev = features.std(dim=0, keepdims=True) + 1e-5
         features = (features - mean) / stddev
         features = features.numpy()
--- a/scripts/nemo/fast-conformer-hybrid-transducer-ctc/test-onnx-transducer-non-streaming.py
查看文件 @f140577
+++ b/scripts/nemo/fast-conformer-hybrid-transducer-ctc/test-onnx-transducer-non-streaming.py
查看文件 @f140577
@@ -184,12 +184,7 @@ class OnnxModel:
         target = torch.tensor([[token]], dtype=torch.int32).numpy()
         target_len = torch.tensor([1], dtype=torch.int32).numpy()
-        (
-            decoder_out,
-            decoder_out_length,
-            state0_next,
-            state1_next,
-        ) = self.decoder.run(
+        (decoder_out, decoder_out_length, state0_next, state1_next,) = self.decoder.run(
             [
                 self.decoder.get_outputs()[0].name,
                 self.decoder.get_outputs()[1].name,
@@ -267,8 +262,8 @@ def main():
     if model.normalize_type != "":
         assert model.normalize_type == "per_feature", model.normalize_type
         features = torch.from_numpy(features)
-        mean = features.mean(dim=1, keepdims=True)
-        stddev = features.std(dim=1, keepdims=True) + 1e-5
+        mean = features.mean(dim=0, keepdims=True)
+        stddev = features.std(dim=0, keepdims=True) + 1e-5
         features = (features - mean) / stddev
         features = features.numpy()
     print(audio.shape)
--- a/scripts/nemo/parakeet-tdt-0.6b-v2/test_onnx.py
查看文件 @f140577
+++ b/scripts/nemo/parakeet-tdt-0.6b-v2/test_onnx.py
查看文件 @f140577
@@ -233,8 +233,8 @@ def main():
     if model.normalize_type != "":
         assert model.normalize_type == "per_feature", model.normalize_type
         features = torch.from_numpy(features)
-        mean = features.mean(dim=1, keepdims=True)
-        stddev = features.std(dim=1, keepdims=True) + 1e-5
+        mean = features.mean(dim=0, keepdims=True)
+        stddev = features.std(dim=0, keepdims=True) + 1e-5
         features = (features - mean) / stddev
         features = features.numpy()
     print(audio.shape)