Add APIs for Online NeMo CTC models (#2454)

Fangjun Kuang · GitHub
Commit 8ab5cba5981ccafc3fe7a0e691ee8aa591ab5029 8ab5cba5 1 parent 761c1626
.github/scripts/test-nodejs-npm.sh
dotnet-examples/offline-decode-files/Program.cs
dotnet-examples/offline-decode-files/run-paraformer-itn.sh
dotnet-examples/offline-decode-files/run-paraformer.sh
dotnet-examples/offline-decode-files/run-zipformer-ctc.sh
flutter/sherpa_onnx/lib/src/keyword_spotter.dart
flutter/sherpa_onnx/lib/src/online_recognizer.dart
flutter/sherpa_onnx/lib/src/sherpa_onnx_bindings.dart
go-api-examples/non-streaming-canary-decode-files/go.mod
harmony-os/SherpaOnnxHar/sherpa_onnx/Index.ets
harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/cpp/streaming-asr.cc
harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/ets/components/StreamingAsr.ets
mfc-examples/NonStreamingSpeechRecognition/NonStreamingSpeechRecognitionDlg.cpp
scripts/dotnet/OnlineModelConfig.cs
scripts/dotnet/OnlineNemoCtcModelConfig.cs
scripts/go/sherpa_onnx.go
sherpa-onnx/c-api/c-api.cc
sherpa-onnx/c-api/c-api.h
sherpa-onnx/c-api/cxx-api.cc
sherpa-onnx/c-api/cxx-api.h
--- a/.github/scripts/test-nodejs-npm.sh
查看文件 @8ab5cba
+++ b/.github/scripts/test-nodejs-npm.sh
查看文件 @8ab5cba
@@ -9,6 +9,49 @@ git status
 ls -lh
 ls -lh node_modules
+# online asr
+curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+tar xvf sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+rm sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+node ./test-online-paraformer.js
+rm -rf sherpa-onnx-streaming-paraformer-bilingual-zh-en
+
+curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
+tar xvf sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
+rm sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
+
+rm -f itn*
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/itn-zh-number.wav
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/itn_zh_number.fst
+
+node ./test-online-transducer-itn.js
+
+node ./test-online-transducer.js
+
+rm -rf sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
+
+curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13.tar.bz2
+tar xvf sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13.tar.bz2
+rm sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13.tar.bz2
+
+node ./test-online-zipformer2-ctc.js
+rm -rf sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13
+
+curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
+tar xvf sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
+rm sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
+node ./test-online-zipformer2-ctc-hlg.js
+rm -rf sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18
+
+echo "----------keyword spotting----------"
+
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/kws-models/sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01.tar.bz2
+tar xvf sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01.tar.bz2
+rm sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01.tar.bz2
+
+node ./test-keyword-spotter-transducer.js
+rm -rf sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01
+
 # asr with offline nemo canary
 curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-nemo-canary-180m-flash-en-es-de-fr-int8.tar.bz2
 tar xvf sherpa-onnx-nemo-canary-180m-flash-en-es-de-fr-int8.tar.bz2
@@ -145,15 +188,6 @@ rm Obama.wav
 rm silero_vad.onnx
 rm -rf sherpa-onnx-whisper-tiny.en
-echo "----------keyword spotting----------"
-
-curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/kws-models/sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01.tar.bz2
-tar xvf sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01.tar.bz2
-rm sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01.tar.bz2
-
-node ./test-keyword-spotter-transducer.js
-rm -rf sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01
-
 # offline asr
 #
 curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2
@@ -218,37 +252,3 @@ rm sherpa-onnx-moonshine-tiny-en-int8.tar.bz2
 node ./test-offline-moonshine.js
 rm -rf sherpa-onnx-moonshine-*
-
-# online asr
-curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
-tar xvf sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
-rm sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
-node ./test-online-paraformer.js
-rm -rf sherpa-onnx-streaming-paraformer-bilingual-zh-en
-
-curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
-tar xvf sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
-rm sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
-
-rm -f itn*
-curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/itn-zh-number.wav
-curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/itn_zh_number.fst
-
-node ./test-online-transducer-itn.js
-
-node ./test-online-transducer.js
-
-rm -rf sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
-
-curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13.tar.bz2
-tar xvf sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13.tar.bz2
-rm sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13.tar.bz2
-
-node ./test-online-zipformer2-ctc.js
-rm -rf sherpa-onnx-streaming-zipformer-ctc-multi-zh-hans-2023-12-13
-
-curl -LS -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
-tar xvf sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
-rm sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
-node ./test-online-zipformer2-ctc-hlg.js
-rm -rf sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18
--- a/dotnet-examples/offline-decode-files/Program.cs
查看文件 @8ab5cba
+++ b/dotnet-examples/offline-decode-files/Program.cs
查看文件 @8ab5cba
@@ -148,7 +148,7 @@ to download pre-trained non-streaming zipformer models.
 dotnet run \
   --tokens=./sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt \
-  --paraformer=./sherpa-onnx-paraformer-zh-2023-09-14/model.onnx \
+  --paraformer=./sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx \
   --files ./sherpa-onnx-zipformer-en-2023-04-01/test_wavs/0.wav \
   ./sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/0.wav \
   ./sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/1.wav \
--- a/dotnet-examples/offline-decode-files/run-paraformer-itn.sh
查看文件 @8ab5cba
+++ b/dotnet-examples/offline-decode-files/run-paraformer-itn.sh
查看文件 @8ab5cba
@@ -18,7 +18,7 @@ fi
 dotnet run \
   --tokens=./sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt \
-  --paraformer=./sherpa-onnx-paraformer-zh-2023-09-14/model.onnx \
+  --paraformer=./sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx \
   --rule-fsts=./itn_zh_number.fst \
   --num-threads=2 \
   --files ./itn-zh-number.wav
--- a/dotnet-examples/offline-decode-files/run-paraformer.sh
查看文件 @8ab5cba
+++ b/dotnet-examples/offline-decode-files/run-paraformer.sh
查看文件 @8ab5cba
@@ -10,7 +10,7 @@ fi
 dotnet run \
   --tokens=./sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt \
-  --paraformer=./sherpa-onnx-paraformer-zh-2023-09-14/model.onnx \
+  --paraformer=./sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx \
   --num-threads=2 \
   --files ./sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/0.wav \
   ./sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/1.wav \
--- a/dotnet-examples/offline-decode-files/run-zipformer-ctc.sh
查看文件 @8ab5cba
+++ b/dotnet-examples/offline-decode-files/run-zipformer-ctc.sh
查看文件 @8ab5cba
@@ -13,6 +13,4 @@ dotnet run \
   --tokens=./sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03/tokens.txt \
   --zipformer-ctc=./sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03/model.int8.onnx \
   --num-threads=1 \
-  --files ./sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03/test_wavs/0.wav \
-  ./sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03/test_wavs/1.wav \
-  ./sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03/test_wavs/8k.wav
+  --files ./sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03/test_wavs/0.wav
--- a/flutter/sherpa_onnx/lib/src/keyword_spotter.dart
查看文件 @8ab5cba
+++ b/flutter/sherpa_onnx/lib/src/keyword_spotter.dart
查看文件 @8ab5cba
@@ -121,6 +121,9 @@ class KeywordSpotter {
     c.ref.model.zipformer2Ctc.model =
         config.model.zipformer2Ctc.model.toNativeUtf8();
+    // nemoCtc
+    c.ref.model.nemoCtc.model = config.model.nemoCtc.model.toNativeUtf8();
+
     c.ref.model.tokens = config.model.tokens.toNativeUtf8();
     c.ref.model.numThreads = config.model.numThreads;
     c.ref.model.provider = config.model.provider.toNativeUtf8();
@@ -146,6 +149,7 @@ class KeywordSpotter {
     calloc.free(c.ref.model.modelType);
     calloc.free(c.ref.model.provider);
     calloc.free(c.ref.model.tokens);
+    calloc.free(c.ref.model.nemoCtc.model);
     calloc.free(c.ref.model.zipformer2Ctc.model);
     calloc.free(c.ref.model.paraformer.encoder);
     calloc.free(c.ref.model.paraformer.decoder);
--- a/flutter/sherpa_onnx/lib/src/online_recognizer.dart
查看文件 @8ab5cba
+++ b/flutter/sherpa_onnx/lib/src/online_recognizer.dart
查看文件 @8ab5cba
@@ -86,11 +86,33 @@ class OnlineZipformer2CtcModelConfig {
   final String model;
 }
+class OnlineNemoCtcModelConfig {
+  const OnlineNemoCtcModelConfig({this.model = ''});
+
+  factory OnlineNemoCtcModelConfig.fromJson(Map<String, dynamic> json) {
+    return OnlineNemoCtcModelConfig(
+      model: json['model'] as String? ?? '',
+    );
+  }
+
+  @override
+  String toString() {
+    return 'OnlineNemoCtcModelConfig(model: $model)';
+  }
+
+  Map<String, dynamic> toJson() => {
+        'model': model,
+      };
+
+  final String model;
+}
+
 class OnlineModelConfig {
   const OnlineModelConfig({
     this.transducer = const OnlineTransducerModelConfig(),
     this.paraformer = const OnlineParaformerModelConfig(),
     this.zipformer2Ctc = const OnlineZipformer2CtcModelConfig(),
+    this.nemoCtc = const OnlineNemoCtcModelConfig(),
     required this.tokens,
     this.numThreads = 1,
     this.provider = 'cpu',
@@ -108,6 +130,8 @@ class OnlineModelConfig {
           json['paraformer'] as Map<String, dynamic>? ?? const {}),
       zipformer2Ctc: OnlineZipformer2CtcModelConfig.fromJson(
           json['zipformer2Ctc'] as Map<String, dynamic>? ?? const {}),
+      nemoCtc: OnlineNemoCtcModelConfig.fromJson(
+          json['nemoCtc'] as Map<String, dynamic>? ?? const {}),
       tokens: json['tokens'] as String,
       numThreads: json['numThreads'] as int? ?? 1,
       provider: json['provider'] as String? ?? 'cpu',
@@ -120,13 +144,14 @@ class OnlineModelConfig {
   @override
   String toString() {
-    return 'OnlineModelConfig(transducer: $transducer, paraformer: $paraformer, zipformer2Ctc: $zipformer2Ctc, tokens: $tokens, numThreads: $numThreads, provider: $provider, debug: $debug, modelType: $modelType, modelingUnit: $modelingUnit, bpeVocab: $bpeVocab)';
+    return 'OnlineModelConfig(transducer: $transducer, paraformer: $paraformer, zipformer2Ctc: $zipformer2Ctc, nemoCtc: $nemoCtc, tokens: $tokens, numThreads: $numThreads, provider: $provider, debug: $debug, modelType: $modelType, modelingUnit: $modelingUnit, bpeVocab: $bpeVocab)';
   }
   Map<String, dynamic> toJson() => {
         'transducer': transducer.toJson(),
         'paraformer': paraformer.toJson(),
         'zipformer2Ctc': zipformer2Ctc.toJson(),
+        'nemoCtc': nemoCtc.toJson(),
         'tokens': tokens,
         'numThreads': numThreads,
         'provider': provider,
@@ -139,6 +164,7 @@ class OnlineModelConfig {
   final OnlineTransducerModelConfig transducer;
   final OnlineParaformerModelConfig paraformer;
   final OnlineZipformer2CtcModelConfig zipformer2Ctc;
+  final OnlineNemoCtcModelConfig nemoCtc;
   final String tokens;
@@ -333,6 +359,9 @@ class OnlineRecognizer {
     c.ref.model.zipformer2Ctc.model =
         config.model.zipformer2Ctc.model.toNativeUtf8();
+    // nemoCtc
+    c.ref.model.nemoCtc.model = config.model.nemoCtc.model.toNativeUtf8();
+
     c.ref.model.tokens = config.model.tokens.toNativeUtf8();
     c.ref.model.numThreads = config.model.numThreads;
     c.ref.model.provider = config.model.provider.toNativeUtf8();
@@ -377,6 +406,7 @@ class OnlineRecognizer {
     calloc.free(c.ref.model.modelType);
     calloc.free(c.ref.model.provider);
     calloc.free(c.ref.model.tokens);
+    calloc.free(c.ref.model.nemoCtc.model);
     calloc.free(c.ref.model.zipformer2Ctc.model);
     calloc.free(c.ref.model.paraformer.encoder);
     calloc.free(c.ref.model.paraformer.decoder);
--- a/flutter/sherpa_onnx/lib/src/sherpa_onnx_bindings.dart
查看文件 @8ab5cba
+++ b/flutter/sherpa_onnx/lib/src/sherpa_onnx_bindings.dart
查看文件 @8ab5cba
@@ -388,6 +388,10 @@ final class SherpaOnnxOnlineZipformer2CtcModelConfig extends Struct {
   external Pointer<Utf8> model;
 }
+final class SherpaOnnxOnlineNemoCtcModelConfig extends Struct {
+  external Pointer<Utf8> model;
+}
+
 final class SherpaOnnxOnlineModelConfig extends Struct {
   external SherpaOnnxOnlineTransducerModelConfig transducer;
   external SherpaOnnxOnlineParaformerModelConfig paraformer;
@@ -413,6 +417,8 @@ final class SherpaOnnxOnlineModelConfig extends Struct {
   @Int32()
   external int tokensBufSize;
+
+  external SherpaOnnxOnlineNemoCtcModelConfig nemoCtc;
 }
 final class SherpaOnnxOnlineCtcFstDecoderConfig extends Struct {
--- a/go-api-examples/non-streaming-canary-decode-files/go.mod
查看文件 @8ab5cba
+++ b/go-api-examples/non-streaming-canary-decode-files/go.mod
查看文件 @8ab5cba
 module non-streaming-canary-decode-files
 go 1.17
-
-require (
-	github.com/k2-fsa/sherpa-onnx-go v1.12.4
-	github.com/spf13/pflag v1.0.6
-	github.com/youpy/go-wav v0.3.2
-)
-
-require (
-	github.com/k2-fsa/sherpa-onnx-go-linux v1.12.4 // indirect
-	github.com/k2-fsa/sherpa-onnx-go-macos v1.12.4 // indirect
-	github.com/k2-fsa/sherpa-onnx-go-windows v1.12.4 // indirect
-	github.com/youpy/go-riff v0.1.0 // indirect
-	github.com/zaf/g711 v0.0.0-20190814101024-76a4a538f52b // indirect
-)
--- a/harmony-os/SherpaOnnxHar/sherpa_onnx/Index.ets
查看文件 @8ab5cba
+++ b/harmony-os/SherpaOnnxHar/sherpa_onnx/Index.ets
查看文件 @8ab5cba
@@ -25,6 +25,7 @@ export { Samples,
 } from './src/main/ets/components/NonStreamingAsr';
 export { OnlineStream,
+  OnlineNemoCtcModelConfig,
   OnlineTransducerModelConfig,
   OnlineParaformerModelConfig,
   OnlineZipformer2CtcModelConfig,
--- a/harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/cpp/streaming-asr.cc
查看文件 @8ab5cba
+++ b/harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/cpp/streaming-asr.cc
查看文件 @8ab5cba
@@ -73,6 +73,22 @@ GetOnlineZipformer2CtcModelConfig(Napi::Object obj) {
   return c;
 }
+static SherpaOnnxOnlineNemoCtcModelConfig GetOnlineNemoCtcModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOnlineNemoCtcModelConfig c;
+  memset(&c, 0, sizeof(c));
+
+  if (!obj.Has("nemoCtc") || !obj.Get("nemoCtc").IsObject()) {
+    return c;
+  }
+
+  Napi::Object o = obj.Get("nemoCtc").As<Napi::Object>();
+
+  SHERPA_ONNX_ASSIGN_ATTR_STR(model, model);
+
+  return c;
+}
+
 static SherpaOnnxOnlineParaformerModelConfig GetOnlineParaformerModelConfig(
     Napi::Object obj) {
   SherpaOnnxOnlineParaformerModelConfig c;
@@ -103,6 +119,7 @@ SherpaOnnxOnlineModelConfig GetOnlineModelConfig(Napi::Object obj) {
   c.transducer = GetOnlineTransducerModelConfig(o);
   c.paraformer = GetOnlineParaformerModelConfig(o);
   c.zipformer2_ctc = GetOnlineZipformer2CtcModelConfig(o);
+  c.nemo_ctc = GetOnlineNemoCtcModelConfig(o);
   SHERPA_ONNX_ASSIGN_ATTR_STR(tokens, tokens);
   SHERPA_ONNX_ASSIGN_ATTR_INT32(num_threads, numThreads);
@@ -248,6 +265,7 @@ static Napi::External<SherpaOnnxOnlineRecognizer> CreateOnlineRecognizerWrapper(
   SHERPA_ONNX_DELETE_C_STR(c.model_config.paraformer.encoder);
   SHERPA_ONNX_DELETE_C_STR(c.model_config.paraformer.decoder);
+  SHERPA_ONNX_DELETE_C_STR(c.model_config.nemo_ctc.model);
   SHERPA_ONNX_DELETE_C_STR(c.model_config.zipformer2_ctc.model);
   SHERPA_ONNX_DELETE_C_STR(c.model_config.tokens);
   SHERPA_ONNX_DELETE_C_STR(c.model_config.provider);
--- a/harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/ets/components/StreamingAsr.ets
查看文件 @8ab5cba
+++ b/harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/ets/components/StreamingAsr.ets
查看文件 @8ab5cba
@@ -46,10 +46,15 @@ export class OnlineZipformer2CtcModelConfig {
   public model: string = '';
 }
+export class OnlineNemoCtcModelConfig {
+  public model: string = '';
+}
+
 export class OnlineModelConfig {
   public transducer: OnlineTransducerModelConfig = new OnlineTransducerModelConfig();
   public paraformer: OnlineParaformerModelConfig = new OnlineParaformerModelConfig();
   public zipformer2_ctc: OnlineZipformer2CtcModelConfig = new OnlineZipformer2CtcModelConfig();
+  public nemo_ctc: OnlineNemoCtcModelConfig = new OnlineNemoCtcModelConfig();
   public tokens: string = '';
   public numThreads: number = 1;
   public provider: string = 'cpu';
--- a/mfc-examples/NonStreamingSpeechRecognition/NonStreamingSpeechRecognitionDlg.cpp
查看文件 @8ab5cba
+++ b/mfc-examples/NonStreamingSpeechRecognition/NonStreamingSpeechRecognitionDlg.cpp
查看文件 @8ab5cba
@@ -338,7 +338,7 @@ void CNonStreamingSpeechRecognitionDlg::ShowInitRecognizerHelpMessage() {
   msg +=
       "wget "
       "https://huggingface.co/csukuangfj/"
-      "sherpa-onnx-paraformer-zh-2023-09-14/resolve/main/model.onnx\r\n";
+      "sherpa-onnx-paraformer-zh-2023-09-14/resolve/main/model.int8.onnx\r\n";
   msg +=
       "wget "
       "https://huggingface.co/csukuangfj/sherpa-onnx-paraformer-zh-2023-09-14/"
--- a/scripts/dotnet/OnlineModelConfig.cs
查看文件 @8ab5cba
+++ b/scripts/dotnet/OnlineModelConfig.cs
查看文件 @8ab5cba
@@ -24,6 +24,7 @@ namespace SherpaOnnx
             BpeVocab = "";
             TokensBuf = "";
             TokensBufSize = 0;
+            NemoCtc = new OnlineNemoCtcModelConfig();
         }
         public OnlineTransducerModelConfig Transducer;
@@ -55,6 +56,8 @@ namespace SherpaOnnx
         public string TokensBuf;
         public int TokensBufSize;
+
+        public OnlineNemoCtcModelConfig NemoCtc;
     }
 }
--- a/scripts/dotnet/OnlineNemoCtcModelConfig.cs 0 → 100644
查看文件 @8ab5cba
+++ b/scripts/dotnet/OnlineNemoCtcModelConfig.cs 0 → 100644
查看文件 @8ab5cba
+/// Copyright (c)  2025  Xiaomi Corporation (authors: Fangjun Kuang)
+
+using System.Runtime.InteropServices;
+
+namespace SherpaOnnx
+{
+    [StructLayout(LayoutKind.Sequential)]
+    public struct OnlineNemoCtcModelConfig
+    {
+        public OnlineNemoCtcModelConfig()
+        {
+            Model = "";
+        }
+
+        [MarshalAs(UnmanagedType.LPStr)]
+        public string Model;
+    }
+}
--- a/scripts/go/sherpa_onnx.go
查看文件 @8ab5cba
+++ b/scripts/go/sherpa_onnx.go
查看文件 @8ab5cba
@@ -77,6 +77,10 @@ type OnlineZipformer2CtcModelConfig struct {
 	Model string // Path to the onnx model
 }
+type OnlineNemoCtcModelConfig struct {
+	Model string // Path to the onnx model
+}
+
 // Configuration for online/streaming models
 //
 // Please refer to
@@ -87,6 +91,7 @@ type OnlineModelConfig struct {
 	Transducer    OnlineTransducerModelConfig
 	Paraformer    OnlineParaformerModelConfig
 	Zipformer2Ctc OnlineZipformer2CtcModelConfig
+	NemoCtc       OnlineNemoCtcModelConfig
 	Tokens        string // Path to tokens.txt
 	NumThreads    int    // Number of threads to use for neural network computation
 	Provider      string // Optional. Valid values are: cpu, cuda, coreml
@@ -197,6 +202,9 @@ func NewOnlineRecognizer(config *OnlineRecognizerConfig) *OnlineRecognizer {
 	c.model_config.zipformer2_ctc.model = C.CString(config.ModelConfig.Zipformer2Ctc.Model)
 	defer C.free(unsafe.Pointer(c.model_config.zipformer2_ctc.model))
+	c.model_config.nemo_ctc.model = C.CString(config.ModelConfig.NemoCtc.Model)
+	defer C.free(unsafe.Pointer(c.model_config.nemo_ctc.model))
+
 	c.model_config.tokens = C.CString(config.ModelConfig.Tokens)
 	defer C.free(unsafe.Pointer(c.model_config.tokens))
@@ -1814,6 +1822,9 @@ func NewKeywordSpotter(config *KeywordSpotterConfig) *KeywordSpotter {
 	c.model_config.zipformer2_ctc.model = C.CString(config.ModelConfig.Zipformer2Ctc.Model)
 	defer C.free(unsafe.Pointer(c.model_config.zipformer2_ctc.model))
+	c.model_config.nemo_ctc.model = C.CString(config.ModelConfig.NemoCtc.Model)
+	defer C.free(unsafe.Pointer(c.model_config.nemo_ctc.model))
+
 	c.model_config.tokens = C.CString(config.ModelConfig.Tokens)
 	defer C.free(unsafe.Pointer(c.model_config.tokens))
--- a/sherpa-onnx/c-api/c-api.cc
查看文件 @8ab5cba
+++ b/sherpa-onnx/c-api/c-api.cc
查看文件 @8ab5cba
@@ -97,6 +97,9 @@ static sherpa_onnx::OnlineRecognizerConfig GetOnlineRecognizerConfig(
         config->model_config.tokens_buf, config->model_config.tokens_buf_size);
   }
+  recognizer_config.model_config.nemo_ctc.model =
+      SHERPA_ONNX_OR(config->model_config.nemo_ctc.model, "");
+
   recognizer_config.model_config.num_threads =
       SHERPA_ONNX_OR(config->model_config.num_threads, 1);
   recognizer_config.model_config.provider_config.provider =
@@ -108,8 +111,7 @@ static sherpa_onnx::OnlineRecognizerConfig GetOnlineRecognizerConfig(
   recognizer_config.model_config.model_type =
       SHERPA_ONNX_OR(config->model_config.model_type, "");
-  recognizer_config.model_config.debug =
-      SHERPA_ONNX_OR(config->model_config.debug, 0);
+  recognizer_config.model_config.debug = config->model_config.debug;
   recognizer_config.model_config.modeling_unit =
       SHERPA_ONNX_OR(config->model_config.modeling_unit, "cjkchar");
@@ -431,8 +433,7 @@ static sherpa_onnx::OfflineRecognizerConfig GetOfflineRecognizerConfig(
       SHERPA_ONNX_OR(config->model_config.tokens, "");
   recognizer_config.model_config.num_threads =
       SHERPA_ONNX_OR(config->model_config.num_threads, 1);
-  recognizer_config.model_config.debug =
-      SHERPA_ONNX_OR(config->model_config.debug, 0);
+  recognizer_config.model_config.debug = config->model_config.debug;
   recognizer_config.model_config.provider =
       SHERPA_ONNX_OR(config->model_config.provider, "cpu");
   if (recognizer_config.model_config.provider.empty()) {
@@ -759,6 +760,9 @@ static sherpa_onnx::KeywordSpotterConfig GetKeywordSpotterConfig(
   spotter_config.model_config.zipformer2_ctc.model =
       SHERPA_ONNX_OR(config->model_config.zipformer2_ctc.model, "");
+  spotter_config.model_config.nemo_ctc.model =
+      SHERPA_ONNX_OR(config->model_config.nemo_ctc.model, "");
+
   spotter_config.model_config.tokens =
       SHERPA_ONNX_OR(config->model_config.tokens, "");
   if (config->model_config.tokens_buf &&
@@ -777,8 +781,7 @@ static sherpa_onnx::KeywordSpotterConfig GetKeywordSpotterConfig(
   spotter_config.model_config.model_type =
       SHERPA_ONNX_OR(config->model_config.model_type, "");
-  spotter_config.model_config.debug =
-      SHERPA_ONNX_OR(config->model_config.debug, 0);
+  spotter_config.model_config.debug = config->model_config.debug;
   spotter_config.max_active_paths = SHERPA_ONNX_OR(config->max_active_paths, 4);
@@ -1055,7 +1058,7 @@ sherpa_onnx::VadModelConfig GetVadModelConfig(
     vad_config.provider = "cpu";
   }
-  vad_config.debug = SHERPA_ONNX_OR(config->debug, false);
+  vad_config.debug = config->debug;
   if (vad_config.debug) {
 #if __OHOS__
@@ -1542,7 +1545,7 @@ GetSpeakerEmbeddingExtractorConfig(
   c.model = SHERPA_ONNX_OR(config->model, "");
   c.num_threads = SHERPA_ONNX_OR(config->num_threads, 1);
-  c.debug = SHERPA_ONNX_OR(config->debug, 0);
+  c.debug = config->debug;
   c.provider = SHERPA_ONNX_OR(config->provider, "cpu");
   if (c.provider.empty()) {
     c.provider = "cpu";
--- a/sherpa-onnx/c-api/c-api.h
查看文件 @8ab5cba
+++ b/sherpa-onnx/c-api/c-api.h
查看文件 @8ab5cba
@@ -100,6 +100,10 @@ SHERPA_ONNX_API typedef struct SherpaOnnxOnlineZipformer2CtcModelConfig {
   const char *model;
 } SherpaOnnxOnlineZipformer2CtcModelConfig;
+SHERPA_ONNX_API typedef struct SherpaOnnxOnlineNemoCtcModelConfig {
+  const char *model;
+} SherpaOnnxOnlineNemoCtcModelConfig;
+
 SHERPA_ONNX_API typedef struct SherpaOnnxOnlineModelConfig {
   SherpaOnnxOnlineTransducerModelConfig transducer;
   SherpaOnnxOnlineParaformerModelConfig paraformer;
@@ -120,6 +124,7 @@ SHERPA_ONNX_API typedef struct SherpaOnnxOnlineModelConfig {
   const char *tokens_buf;
   /// byte size excluding the trailing '\0'
   int32_t tokens_buf_size;
+  SherpaOnnxOnlineNemoCtcModelConfig nemo_ctc;
 } SherpaOnnxOnlineModelConfig;
 /// It expects 16 kHz 16-bit single channel wave format.
--- a/sherpa-onnx/c-api/cxx-api.cc
查看文件 @8ab5cba
+++ b/sherpa-onnx/c-api/cxx-api.cc
查看文件 @8ab5cba
@@ -69,6 +69,8 @@ OnlineRecognizer OnlineRecognizer::Create(
   c.model_config.zipformer2_ctc.model =
       config.model_config.zipformer2_ctc.model.c_str();
+  c.model_config.nemo_ctc.model = config.model_config.nemo_ctc.model.c_str();
+
   c.model_config.tokens = config.model_config.tokens.c_str();
   c.model_config.num_threads = config.model_config.num_threads;
   c.model_config.provider = config.model_config.provider.c_str();
@@ -473,6 +475,8 @@ KeywordSpotter KeywordSpotter::Create(const KeywordSpotterConfig &config) {
   c.model_config.zipformer2_ctc.model =
       config.model_config.zipformer2_ctc.model.c_str();
+  c.model_config.nemo_ctc.model = config.model_config.nemo_ctc.model.c_str();
+
   c.model_config.tokens = config.model_config.tokens.c_str();
   c.model_config.num_threads = config.model_config.num_threads;
   c.model_config.provider = config.model_config.provider.c_str();
--- a/sherpa-onnx/c-api/cxx-api.h
查看文件 @8ab5cba
+++ b/sherpa-onnx/c-api/cxx-api.h
查看文件 @8ab5cba
@@ -32,10 +32,15 @@ struct OnlineZipformer2CtcModelConfig {
   std::string model;
 };
+struct OnlineNemoCtcModelConfig {
+  std::string model;
+};
+
 struct OnlineModelConfig {
   OnlineTransducerModelConfig transducer;
   OnlineParaformerModelConfig paraformer;
   OnlineZipformer2CtcModelConfig zipformer2_ctc;
+  OnlineNemoCtcModelConfig nemo_ctc;
   std::string tokens;
   int32_t num_threads = 1;
   std::string provider = "cpu";
--- a/sherpa-onnx/csrc/rknn/silero-vad-model-rknn.cc
查看文件 @8ab5cba
+++ b/sherpa-onnx/csrc/rknn/silero-vad-model-rknn.cc
查看文件 @8ab5cba
@@ -175,6 +175,77 @@ class SileroVadModelRknn::Impl {
     config_.silero_vad.threshold = threshold;
   }
+  float Run(const float *samples, int32_t n) {
+    std::vector<rknn_input> inputs(input_attrs_.size());
+
+    for (int32_t i = 0; i < static_cast<int32_t>(inputs.size()); ++i) {
+      auto &input = inputs[i];
+      auto &attr = input_attrs_[i];
+      input.index = attr.index;
+
+      if (attr.type == RKNN_TENSOR_FLOAT16) {
+        input.type = RKNN_TENSOR_FLOAT32;
+      } else if (attr.type == RKNN_TENSOR_INT64) {
+        input.type = RKNN_TENSOR_INT64;
+      } else {
+        SHERPA_ONNX_LOGE("Unsupported tensor type %d, %s", attr.type,
+                         get_type_string(attr.type));
+        SHERPA_ONNX_EXIT(-1);
+      }
+
+      input.fmt = attr.fmt;
+      if (i == 0) {
+        input.buf = reinterpret_cast<void *>(const_cast<float *>(samples));
+        input.size = n * sizeof(float);
+      } else {
+        input.buf = reinterpret_cast<void *>(states_[i - 1].data());
+        input.size = states_[i - 1].size() * sizeof(float);
+      }
+    }
+
+    std::vector<float> out(output_attrs_[0].n_elems);
+
+    auto &next_states = states_;
+
+    std::vector<rknn_output> outputs(output_attrs_.size());
+
+    for (int32_t i = 0; i < outputs.size(); ++i) {
+      auto &output = outputs[i];
+      auto &attr = output_attrs_[i];
+      output.index = attr.index;
+      output.is_prealloc = 1;
+
+      if (attr.type == RKNN_TENSOR_FLOAT16) {
+        output.want_float = 1;
+      } else if (attr.type == RKNN_TENSOR_INT64) {
+        output.want_float = 0;
+      } else {
+        SHERPA_ONNX_LOGE("Unsupported tensor type %d, %s", attr.type,
+                         get_type_string(attr.type));
+        SHERPA_ONNX_EXIT(-1);
+      }
+
+      if (i == 0) {
+        output.size = out.size() * sizeof(float);
+        output.buf = reinterpret_cast<void *>(out.data());
+      } else {
+        output.size = next_states[i - 1].size() * sizeof(float);
+        output.buf = reinterpret_cast<void *>(next_states[i - 1].data());
+      }
+    }
+
+    auto ret = rknn_inputs_set(ctx_, inputs.size(), inputs.data());
+    SHERPA_ONNX_RKNN_CHECK(ret, "Failed to set inputs");
+
+    ret = rknn_run(ctx_, nullptr);
+    SHERPA_ONNX_RKNN_CHECK(ret, "Failed to run the model");
+
+    ret = rknn_outputs_get(ctx_, outputs.size(), outputs.data(), nullptr);
+    SHERPA_ONNX_RKNN_CHECK(ret, "Failed to get model output");
+
+    return out[0];
+  }
+
  private:
   void Init(void *model_data, size_t model_data_length) {
     InitContext(model_data, model_data_length, config_.debug, &ctx_);
@@ -267,77 +338,6 @@ class SileroVadModelRknn::Impl {
     Reset();
   }
-  float Run(const float *samples, int32_t n) {
-    std::vector<rknn_input> inputs(input_attrs_.size());
-
-    for (int32_t i = 0; i < static_cast<int32_t>(inputs.size()); ++i) {
-      auto &input = inputs[i];
-      auto &attr = input_attrs_[i];
-      input.index = attr.index;
-
-      if (attr.type == RKNN_TENSOR_FLOAT16) {
-        input.type = RKNN_TENSOR_FLOAT32;
-      } else if (attr.type == RKNN_TENSOR_INT64) {
-        input.type = RKNN_TENSOR_INT64;
-      } else {
-        SHERPA_ONNX_LOGE("Unsupported tensor type %d, %s", attr.type,
-                         get_type_string(attr.type));
-        SHERPA_ONNX_EXIT(-1);
-      }
-
-      input.fmt = attr.fmt;
-      if (i == 0) {
-        input.buf = reinterpret_cast<void *>(const_cast<float *>(samples));
-        input.size = n * sizeof(float);
-      } else {
-        input.buf = reinterpret_cast<void *>(states_[i - 1].data());
-        input.size = states_[i - 1].size() * sizeof(float);
-      }
-    }
-
-    std::vector<float> out(output_attrs_[0].n_elems);
-
-    auto &next_states = states_;
-
-    std::vector<rknn_output> outputs(output_attrs_.size());
-
-    for (int32_t i = 0; i < outputs.size(); ++i) {
-      auto &output = outputs[i];
-      auto &attr = output_attrs_[i];
-      output.index = attr.index;
-      output.is_prealloc = 1;
-
-      if (attr.type == RKNN_TENSOR_FLOAT16) {
-        output.want_float = 1;
-      } else if (attr.type == RKNN_TENSOR_INT64) {
-        output.want_float = 0;
-      } else {
-        SHERPA_ONNX_LOGE("Unsupported tensor type %d, %s", attr.type,
-                         get_type_string(attr.type));
-        SHERPA_ONNX_EXIT(-1);
-      }
-
-      if (i == 0) {
-        output.size = out.size() * sizeof(float);
-        output.buf = reinterpret_cast<void *>(out.data());
-      } else {
-        output.size = next_states[i - 1].size() * sizeof(float);
-        output.buf = reinterpret_cast<void *>(next_states[i - 1].data());
-      }
-    }
-
-    auto ret = rknn_inputs_set(ctx_, inputs.size(), inputs.data());
-    SHERPA_ONNX_RKNN_CHECK(ret, "Failed to set inputs");
-
-    ret = rknn_run(ctx_, nullptr);
-    SHERPA_ONNX_RKNN_CHECK(ret, "Failed to run the model");
-
-    ret = rknn_outputs_get(ctx_, outputs.size(), outputs.data(), nullptr);
-    SHERPA_ONNX_RKNN_CHECK(ret, "Failed to get model output");
-
-    return out[0];
-  }
-
  private:
   VadModelConfig config_;
   rknn_context ctx_ = 0;
@@ -395,6 +395,10 @@ void SileroVadModelRknn::SetThreshold(float threshold) {
   impl_->SetThreshold(threshold);
 }
+float SileroVadModelRknn::Compute(const float *samples, int32_t n) {
+  return impl_->Run(samples, n);
+}
+
 #if __ANDROID_API__ >= 9
 template SileroVadModelRknn::SileroVadModelRknn(AAssetManager *mgr,
                                                 const VadModelConfig &config);
--- a/sherpa-onnx/csrc/rknn/silero-vad-model-rknn.h
查看文件 @8ab5cba
+++ b/sherpa-onnx/csrc/rknn/silero-vad-model-rknn.h
查看文件 @8ab5cba
@@ -32,6 +32,7 @@ class SileroVadModelRknn : public VadModel {
    * @return Return true if speech is detected. Return false otherwise.
    */
   bool IsSpeech(const float *samples, int32_t n) override;
+  float Compute(const float *samples, int32_t n) override;
   // For silero vad V4, it is WindowShift().
   int32_t WindowSize() const override;
--- a/sherpa-onnx/jni/common.h
查看文件 @8ab5cba
+++ b/sherpa-onnx/jni/common.h
查看文件 @8ab5cba
@@ -89,8 +89,8 @@ void SafeJNI(JNIEnv *env, const char *functionName, Func func) {
 }
 // Helper function to validate JNI pointers
-inline bool ValidatePointer(JNIEnv *env, jlong ptr,
-                            const char *functionName, const char *message) {
+inline bool ValidatePointer(JNIEnv *env, jlong ptr, const char *functionName,
+                            const char *message) {
   if (ptr == 0) {
     jclass exClass = env->FindClass("java/lang/NullPointerException");
     if (exClass != nullptr) {
--- a/sherpa-onnx/jni/keyword-spotter.cc
查看文件 @8ab5cba
+++ b/sherpa-onnx/jni/keyword-spotter.cc
查看文件 @8ab5cba
@@ -9,6 +9,9 @@
 namespace sherpa_onnx {
+OnlineModelConfig GetOnlineModelConfig(JNIEnv *env, jclass model_config_cls,
+                                       jobject model_config);
+
 static KeywordSpotterConfig GetKwsConfig(JNIEnv *env, jobject config) {
   KeywordSpotterConfig ans;
@@ -57,54 +60,7 @@ static KeywordSpotterConfig GetKwsConfig(JNIEnv *env, jobject config) {
                         "Lcom/k2fsa/sherpa/onnx/OnlineModelConfig;");
   jobject model_config = env->GetObjectField(config, fid);
   jclass model_config_cls = env->GetObjectClass(model_config);
-
-  // transducer
-  fid = env->GetFieldID(model_config_cls, "transducer",
-                        "Lcom/k2fsa/sherpa/onnx/OnlineTransducerModelConfig;");
-  jobject transducer_config = env->GetObjectField(model_config, fid);
-  jclass transducer_config_cls = env->GetObjectClass(transducer_config);
-
-  fid = env->GetFieldID(transducer_config_cls, "encoder", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(transducer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.transducer.encoder = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(transducer_config_cls, "decoder", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(transducer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.transducer.decoder = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(transducer_config_cls, "joiner", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(transducer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.transducer.joiner = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "tokens", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.tokens = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "numThreads", "I");
-  ans.model_config.num_threads = env->GetIntField(model_config, fid);
-
-  fid = env->GetFieldID(model_config_cls, "debug", "Z");
-  ans.model_config.debug = env->GetBooleanField(model_config, fid);
-
-  fid = env->GetFieldID(model_config_cls, "provider", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.provider_config.provider = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "modelType", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.model_type = p;
-  env->ReleaseStringUTFChars(s, p);
+  ans.model_config = GetOnlineModelConfig(env, model_config_cls, model_config);
   return ans;
 }
--- a/sherpa-onnx/jni/online-recognizer.cc
查看文件 @8ab5cba
+++ b/sherpa-onnx/jni/online-recognizer.cc
查看文件 @8ab5cba
@@ -10,6 +10,117 @@
 namespace sherpa_onnx {
+OnlineModelConfig GetOnlineModelConfig(JNIEnv *env, jclass model_config_cls,
+                                       jobject model_config) {
+  OnlineModelConfig ans;
+  // transducer
+  auto fid =
+      env->GetFieldID(model_config_cls, "transducer",
+                      "Lcom/k2fsa/sherpa/onnx/OnlineTransducerModelConfig;");
+  jobject transducer_config = env->GetObjectField(model_config, fid);
+  jclass transducer_config_cls = env->GetObjectClass(transducer_config);
+
+  fid = env->GetFieldID(transducer_config_cls, "encoder", "Ljava/lang/String;");
+  auto s = (jstring)env->GetObjectField(transducer_config, fid);
+  auto p = env->GetStringUTFChars(s, nullptr);
+  ans.transducer.encoder = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(transducer_config_cls, "decoder", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(transducer_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.transducer.decoder = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(transducer_config_cls, "joiner", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(transducer_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.transducer.joiner = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  // paraformer
+  fid = env->GetFieldID(model_config_cls, "paraformer",
+                        "Lcom/k2fsa/sherpa/onnx/OnlineParaformerModelConfig;");
+  jobject paraformer_config = env->GetObjectField(model_config, fid);
+  jclass paraformer_config_cls = env->GetObjectClass(paraformer_config);
+
+  fid = env->GetFieldID(paraformer_config_cls, "encoder", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(paraformer_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.paraformer.encoder = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(paraformer_config_cls, "decoder", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(paraformer_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.paraformer.decoder = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  // streaming zipformer2 CTC
+  fid =
+      env->GetFieldID(model_config_cls, "zipformer2Ctc",
+                      "Lcom/k2fsa/sherpa/onnx/OnlineZipformer2CtcModelConfig;");
+  jobject zipformer2_ctc_config = env->GetObjectField(model_config, fid);
+  jclass zipformer2_ctc_config_cls = env->GetObjectClass(zipformer2_ctc_config);
+
+  fid =
+      env->GetFieldID(zipformer2_ctc_config_cls, "model", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(zipformer2_ctc_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.zipformer2_ctc.model = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  // streaming NeMo CTC
+  fid = env->GetFieldID(model_config_cls, "neMoCtc",
+                        "Lcom/k2fsa/sherpa/onnx/OnlineNeMoCtcModelConfig;");
+  jobject nemo_ctc_config = env->GetObjectField(model_config, fid);
+  jclass nemo_ctc_config_cls = env->GetObjectClass(nemo_ctc_config);
+
+  fid = env->GetFieldID(nemo_ctc_config_cls, "model", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(nemo_ctc_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.nemo_ctc.model = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(model_config_cls, "tokens", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(model_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.tokens = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(model_config_cls, "numThreads", "I");
+  ans.num_threads = env->GetIntField(model_config, fid);
+
+  fid = env->GetFieldID(model_config_cls, "debug", "Z");
+  ans.debug = env->GetBooleanField(model_config, fid);
+
+  fid = env->GetFieldID(model_config_cls, "provider", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(model_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.provider_config.provider = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(model_config_cls, "modelType", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(model_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.model_type = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(model_config_cls, "modelingUnit", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(model_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.modeling_unit = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  fid = env->GetFieldID(model_config_cls, "bpeVocab", "Ljava/lang/String;");
+  s = (jstring)env->GetObjectField(model_config, fid);
+  p = env->GetStringUTFChars(s, nullptr);
+  ans.bpe_vocab = p;
+  env->ReleaseStringUTFChars(s, p);
+
+  return ans;
+}
+
 static OnlineRecognizerConfig GetConfig(JNIEnv *env, jobject config) {
   OnlineRecognizerConfig ans;
@@ -122,109 +233,7 @@ static OnlineRecognizerConfig GetConfig(JNIEnv *env, jobject config) {
   jobject model_config = env->GetObjectField(config, fid);
   jclass model_config_cls = env->GetObjectClass(model_config);
-  // transducer
-  fid = env->GetFieldID(model_config_cls, "transducer",
-                        "Lcom/k2fsa/sherpa/onnx/OnlineTransducerModelConfig;");
-  jobject transducer_config = env->GetObjectField(model_config, fid);
-  jclass transducer_config_cls = env->GetObjectClass(transducer_config);
-
-  fid = env->GetFieldID(transducer_config_cls, "encoder", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(transducer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.transducer.encoder = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(transducer_config_cls, "decoder", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(transducer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.transducer.decoder = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(transducer_config_cls, "joiner", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(transducer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.transducer.joiner = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  // paraformer
-  fid = env->GetFieldID(model_config_cls, "paraformer",
-                        "Lcom/k2fsa/sherpa/onnx/OnlineParaformerModelConfig;");
-  jobject paraformer_config = env->GetObjectField(model_config, fid);
-  jclass paraformer_config_cls = env->GetObjectClass(paraformer_config);
-
-  fid = env->GetFieldID(paraformer_config_cls, "encoder", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(paraformer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.paraformer.encoder = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(paraformer_config_cls, "decoder", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(paraformer_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.paraformer.decoder = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  // streaming zipformer2 CTC
-  fid =
-      env->GetFieldID(model_config_cls, "zipformer2Ctc",
-                      "Lcom/k2fsa/sherpa/onnx/OnlineZipformer2CtcModelConfig;");
-  jobject zipformer2_ctc_config = env->GetObjectField(model_config, fid);
-  jclass zipformer2_ctc_config_cls = env->GetObjectClass(zipformer2_ctc_config);
-
-  fid =
-      env->GetFieldID(zipformer2_ctc_config_cls, "model", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(zipformer2_ctc_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.zipformer2_ctc.model = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  // streaming NeMo CTC
-  fid = env->GetFieldID(model_config_cls, "neMoCtc",
-                        "Lcom/k2fsa/sherpa/onnx/OnlineNeMoCtcModelConfig;");
-  jobject nemo_ctc_config = env->GetObjectField(model_config, fid);
-  jclass nemo_ctc_config_cls = env->GetObjectClass(nemo_ctc_config);
-
-  fid = env->GetFieldID(nemo_ctc_config_cls, "model", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(nemo_ctc_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.nemo_ctc.model = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "tokens", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.tokens = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "numThreads", "I");
-  ans.model_config.num_threads = env->GetIntField(model_config, fid);
-
-  fid = env->GetFieldID(model_config_cls, "debug", "Z");
-  ans.model_config.debug = env->GetBooleanField(model_config, fid);
-
-  fid = env->GetFieldID(model_config_cls, "provider", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.provider_config.provider = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "modelType", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.model_type = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "modelingUnit", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.modeling_unit = p;
-  env->ReleaseStringUTFChars(s, p);
-
-  fid = env->GetFieldID(model_config_cls, "bpeVocab", "Ljava/lang/String;");
-  s = (jstring)env->GetObjectField(model_config, fid);
-  p = env->GetStringUTFChars(s, nullptr);
-  ans.model_config.bpe_vocab = p;
-  env->ReleaseStringUTFChars(s, p);
+  ans.model_config = GetOnlineModelConfig(env, model_config_cls, model_config);
   //---------- rnn lm model config ----------
   fid = env->GetFieldID(cls, "lmConfig",
--- a/sherpa-onnx/pascal-api/sherpa_onnx.pas
查看文件 @8ab5cba
+++ b/sherpa-onnx/pascal-api/sherpa_onnx.pas
查看文件 @8ab5cba
@@ -165,6 +165,11 @@ type
     function ToString: AnsiString;
   end;
+  TSherpaOnnxOnlineNemoCtcModelConfig = record
+    Model: AnsiString;
+    function ToString: AnsiString;
+  end;
+
   TSherpaOnnxOnlineModelConfig = record
     Transducer: TSherpaOnnxOnlineTransducerModelConfig;
     Paraformer: TSherpaOnnxOnlineParaformerModelConfig;
@@ -178,6 +183,7 @@ type
     BpeVocab: AnsiString;
     TokensBuf: AnsiString;
     TokensBufSize: Integer;
+    NemoCtc: TSherpaOnnxOnlineNemoCtcModelConfig;
     function ToString: AnsiString;
     class operator Initialize({$IFDEF FPC}var{$ELSE}out{$ENDIF} Dest: TSherpaOnnxOnlineModelConfig);
   end;
@@ -691,6 +697,10 @@ type
     Model: PAnsiChar;
   end;
+  SherpaOnnxOnlineNemoCtcModelConfig = record
+    Model: PAnsiChar;
+  end;
+
   SherpaOnnxOnlineModelConfig= record
     Transducer: SherpaOnnxOnlineTransducerModelConfig;
     Paraformer: SherpaOnnxOnlineParaformerModelConfig;
@@ -704,6 +714,7 @@ type
     BpeVocab: PAnsiChar;
     TokensBuf: PAnsiChar;
     TokensBufSize: cint32;
+    NemoCtc: SherpaOnnxOnlineNemoCtcModelConfig;
   end;
   SherpaOnnxFeatureConfig = record
     SampleRate: cint32;
@@ -1311,6 +1322,12 @@ begin
   [Self.Model]);
 end;
+function TSherpaOnnxOnlineNemoCtcModelConfig.ToString: AnsiString;
+begin
+  Result := Format('TSherpaOnnxOnlineNemoCtcModelConfig(Model := %s)',
+  [Self.Model]);
+end;
+
 function TSherpaOnnxOnlineModelConfig.ToString: AnsiString;
 begin
   Result := Format('TSherpaOnnxOnlineModelConfig(Transducer := %s, ' +
@@ -1322,12 +1339,13 @@ begin
     'Debug := %s, ' +
     'ModelType := %s, ' +
     'ModelingUnit := %s, ' +
-    'BpeVocab := %s)'
-    ,
+    'BpeVocab := %s, ' +
+    'NemoCtc := %s',
   [Self.Transducer.ToString, Self.Paraformer.ToString,
    Self.Zipformer2Ctc.ToString, Self.Tokens,
    Self.NumThreads, Self.Provider, Self.Debug.ToString,
-   Self.ModelType, Self.ModelingUnit, Self.BpeVocab
+   Self.ModelType, Self.ModelingUnit, Self.BpeVocab,
+   Self.NemoCtc.ToString
   ]);
 end;
@@ -1426,6 +1444,7 @@ begin
   C.ModelConfig.Paraformer.Decoder := PAnsiChar(Config.ModelConfig.Paraformer.Decoder);
   C.ModelConfig.Zipformer2Ctc.Model := PAnsiChar(Config.ModelConfig.Zipformer2Ctc.Model);
+  C.ModelConfig.NemoCtc.Model := PAnsiChar(Config.ModelConfig.NemoCtc.Model);
   C.ModelConfig.Tokens := PAnsiChar(Config.ModelConfig.Tokens);
   C.ModelConfig.NumThreads := Config.ModelConfig.NumThreads;
--- a/sherpa-onnx/python/tests/test_offline_recognizer.py
查看文件 @8ab5cba
+++ b/sherpa-onnx/python/tests/test_offline_recognizer.py
查看文件 @8ab5cba
@@ -128,77 +128,69 @@ class TestOfflineRecognizer(unittest.TestCase):
             print(s2.result.text)
     def test_paraformer_single_file(self):
-        for use_int8 in [True, False]:
-            if use_int8:
-                model = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx"
-            else:
-                model = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/model.onnx"
+        model = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx"
-            tokens = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt"
-            wave0 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/0.wav"
+        tokens = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt"
+        wave0 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/0.wav"
-            if not Path(model).is_file():
-                print("skipping test_paraformer_single_file()")
-                return
+        if not Path(model).is_file():
+            print("skipping test_paraformer_single_file()")
+            return
-            recognizer = sherpa_onnx.OfflineRecognizer.from_paraformer(
-                paraformer=model,
-                tokens=tokens,
-                num_threads=1,
-                provider="cpu",
-            )
+        recognizer = sherpa_onnx.OfflineRecognizer.from_paraformer(
+            paraformer=model,
+            tokens=tokens,
+            num_threads=1,
+            provider="cpu",
+        )
-            s = recognizer.create_stream()
-            samples, sample_rate = read_wave(wave0)
-            s.accept_waveform(sample_rate, samples)
-            recognizer.decode_stream(s)
-            print(s.result.text)
+        s = recognizer.create_stream()
+        samples, sample_rate = read_wave(wave0)
+        s.accept_waveform(sample_rate, samples)
+        recognizer.decode_stream(s)
+        print(s.result.text)
     def test_paraformer_multiple_files(self):
-        for use_int8 in [True, False]:
-            if use_int8:
-                model = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx"
-            else:
-                model = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/model.onnx"
-
-            tokens = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt"
-            wave0 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/0.wav"
-            wave1 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/1.wav"
-            wave2 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/2.wav"
-            wave3 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/8k.wav"
-
-            if not Path(model).is_file():
-                print("skipping test_paraformer_multiple_files()")
-                return
-
-            recognizer = sherpa_onnx.OfflineRecognizer.from_paraformer(
-                paraformer=model,
-                tokens=tokens,
-                num_threads=1,
-                provider="cpu",
-            )
-
-            s0 = recognizer.create_stream()
-            samples0, sample_rate0 = read_wave(wave0)
-            s0.accept_waveform(sample_rate0, samples0)
-
-            s1 = recognizer.create_stream()
-            samples1, sample_rate1 = read_wave(wave1)
-            s1.accept_waveform(sample_rate1, samples1)
-
-            s2 = recognizer.create_stream()
-            samples2, sample_rate2 = read_wave(wave2)
-            s2.accept_waveform(sample_rate2, samples2)
-
-            s3 = recognizer.create_stream()
-            samples3, sample_rate3 = read_wave(wave3)
-            s3.accept_waveform(sample_rate3, samples3)
-
-            recognizer.decode_streams([s0, s1, s2, s3])
-            print(s0.result.text)
-            print(s1.result.text)
-            print(s2.result.text)
-            print(s3.result.text)
+        model = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/model.int8.onnx"
+
+        tokens = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/tokens.txt"
+        wave0 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/0.wav"
+        wave1 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/1.wav"
+        wave2 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/2.wav"
+        wave3 = f"{d}/sherpa-onnx-paraformer-zh-2023-09-14/test_wavs/8k.wav"
+
+        if not Path(model).is_file():
+            print("skipping test_paraformer_multiple_files()")
+            return
+
+        recognizer = sherpa_onnx.OfflineRecognizer.from_paraformer(
+            paraformer=model,
+            tokens=tokens,
+            num_threads=1,
+            provider="cpu",
+        )
+
+        s0 = recognizer.create_stream()
+        samples0, sample_rate0 = read_wave(wave0)
+        s0.accept_waveform(sample_rate0, samples0)
+
+        s1 = recognizer.create_stream()
+        samples1, sample_rate1 = read_wave(wave1)
+        s1.accept_waveform(sample_rate1, samples1)
+
+        s2 = recognizer.create_stream()
+        samples2, sample_rate2 = read_wave(wave2)
+        s2.accept_waveform(sample_rate2, samples2)
+
+        s3 = recognizer.create_stream()
+        samples3, sample_rate3 = read_wave(wave3)
+        s3.accept_waveform(sample_rate3, samples3)
+
+        recognizer.decode_streams([s0, s1, s2, s3])
+        print(s0.result.text)
+        print(s1.result.text)
+        print(s2.result.text)
+        print(s3.result.text)
     def test_nemo_ctc_single_file(self):
         for use_int8 in [True, False]:
--- a/swift-api-examples/SherpaOnnx.swift
查看文件 @8ab5cba
+++ b/swift-api-examples/SherpaOnnx.swift
查看文件 @8ab5cba
@@ -68,6 +68,14 @@ func sherpaOnnxOnlineZipformer2CtcModelConfig(
   )
 }
+func sherpaOnnxOnlineNemoCtcModelConfig(
+  model: String = ""
+) -> SherpaOnnxOnlineNemoCtcModelConfig {
+  return SherpaOnnxOnlineNemoCtcModelConfig(
+    model: toCPointer(model)
+  )
+}
+
 /// Return an instance of SherpaOnnxOnlineModelConfig.
 ///
 /// Please refer to
@@ -92,7 +100,8 @@ func sherpaOnnxOnlineModelConfig(
   modelingUnit: String = "cjkchar",
   bpeVocab: String = "",
   tokensBuf: String = "",
-  tokensBufSize: Int = 0
+  tokensBufSize: Int = 0,
+  nemoCtc: SherpaOnnxOnlineNemoCtcModelConfig = sherpaOnnxOnlineNemoCtcModelConfig()
 ) -> SherpaOnnxOnlineModelConfig {
   return SherpaOnnxOnlineModelConfig(
     transducer: transducer,
@@ -106,7 +115,8 @@ func sherpaOnnxOnlineModelConfig(
     modeling_unit: toCPointer(modelingUnit),
     bpe_vocab: toCPointer(bpeVocab),
     tokens_buf: toCPointer(tokensBuf),
-    tokens_buf_size: Int32(tokensBufSize)
+    tokens_buf_size: Int32(tokensBufSize),
+    nemo_ctc: nemoCtc
   )
 }
--- a/wasm/asr/sherpa-onnx-asr.js
查看文件 @8ab5cba
+++ b/wasm/asr/sherpa-onnx-asr.js
查看文件 @8ab5cba
@@ -15,8 +15,8 @@ function freeConfig(config, Module) {
     freeConfig(config.paraformer, Module)
   }
-  if ('ctc' in config) {
-    freeConfig(config.ctc, Module)
+  if ('zipformer2Ctc' in config) {
+    freeConfig(config.zipformer2Ctc, Module)
   }
   if ('feat' in config) {
@@ -157,6 +157,22 @@ function initSherpaOnnxOnlineZipformer2CtcModelConfig(config, Module) {
   }
 }
+function initSherpaOnnxOnlineNemoCtcModelConfig(config, Module) {
+  const n = Module.lengthBytesUTF8(config.model || '') + 1;
+  const buffer = Module._malloc(n);
+
+  const len = 1 * 4;  // 1 pointer
+  const ptr = Module._malloc(len);
+
+  Module.stringToUTF8(config.model || '', buffer, n);
+
+  Module.setValue(ptr, buffer, 'i8*');
+
+  return {
+    buffer: buffer, ptr: ptr, len: len,
+  }
+}
+
 function initSherpaOnnxOnlineModelConfig(config, Module) {
   if (!('transducer' in config)) {
     config.transducer = {
@@ -179,6 +195,12 @@ function initSherpaOnnxOnlineModelConfig(config, Module) {
     };
   }
+  if (!('nemoCtc' in config)) {
+    config.nemoCtc = {
+      model: '',
+    };
+  }
+
   if (!('tokensBuf' in config)) {
     config.tokensBuf = '';
   }
@@ -193,10 +215,15 @@ function initSherpaOnnxOnlineModelConfig(config, Module) {
   const paraformer =
       initSherpaOnnxOnlineParaformerModelConfig(config.paraformer, Module);
-  const ctc = initSherpaOnnxOnlineZipformer2CtcModelConfig(
+  const zipformer2Ctc = initSherpaOnnxOnlineZipformer2CtcModelConfig(
       config.zipformer2Ctc, Module);
-  const len = transducer.len + paraformer.len + ctc.len + 9 * 4;
+  const nemoCtc =
+      initSherpaOnnxOnlineNemoCtcModelConfig(config.nemoCtc, Module);
+
+  const len =
+      transducer.len + paraformer.len + zipformer2Ctc.len + 9 * 4 + nemoCtc.len;
+
   const ptr = Module._malloc(len);
   let offset = 0;
@@ -206,8 +233,8 @@ function initSherpaOnnxOnlineModelConfig(config, Module) {
   Module._CopyHeap(paraformer.ptr, paraformer.len, ptr + offset);
   offset += paraformer.len;
-  Module._CopyHeap(ctc.ptr, ctc.len, ptr + offset);
-  offset += ctc.len;
+  Module._CopyHeap(zipformer2Ctc.ptr, zipformer2Ctc.len, ptr + offset);
+  offset += zipformer2Ctc.len;
   const tokensLen = Module.lengthBytesUTF8(config.tokens || '') + 1;
   const providerLen = Module.lengthBytesUTF8(config.provider || 'cpu') + 1;
@@ -240,7 +267,7 @@ function initSherpaOnnxOnlineModelConfig(config, Module) {
   Module.stringToUTF8(config.tokensBuf || '', buffer + offset, tokensBufLen);
   offset += tokensBufLen;
-  offset = transducer.len + paraformer.len + ctc.len;
+  offset = transducer.len + paraformer.len + zipformer2Ctc.len;
   Module.setValue(ptr + offset, buffer, 'i8*');  // tokens
   offset += 4;
@@ -278,9 +305,12 @@ function initSherpaOnnxOnlineModelConfig(config, Module) {
   Module.setValue(ptr + offset, config.tokensBufSize || 0, 'i32');
   offset += 4;
+  Module._CopyHeap(nemoCtc.ptr, nemoCtc.len, ptr + offset);
+  offset += nemoCtc.len;
+
   return {
     buffer: buffer, ptr: ptr, len: len, transducer: transducer,
-        paraformer: paraformer, ctc: ctc
+        paraformer: paraformer, zipformer2Ctc: zipformer2Ctc, nemoCtc: nemoCtc
   }
 }
@@ -485,6 +515,10 @@ function createOnlineRecognizer(Module, myConfig) {
     model: '',
   };
+  const onlineNemoCtcModelConfig = {
+    model: '',
+  };
+
   let type = 0;
   switch (type) {
@@ -500,9 +534,13 @@ function createOnlineRecognizer(Module, myConfig) {
       onlineParaformerModelConfig.decoder = './decoder.onnx';
       break;
     case 2:
-      // ctc
+      // zipformer2Ctc
       onlineZipformer2CtcModelConfig.model = './encoder.onnx';
       break;
+    case 3:
+      // nemoCtc
+      onlineNemoCtcModelConfig.model = './nemo-ctc.onnx';
+      break;
   }
@@ -510,6 +548,7 @@ function createOnlineRecognizer(Module, myConfig) {
     transducer: onlineTransducerModelConfig,
     paraformer: onlineParaformerModelConfig,
     zipformer2Ctc: onlineZipformer2CtcModelConfig,
+    nemoCtc: onlineNemoCtcModelConfig,
     tokens: './tokens.txt',
     numThreads: 1,
     provider: 'cpu',
--- a/wasm/asr/sherpa-onnx-wasm-main-asr.cc
查看文件 @8ab5cba
+++ b/wasm/asr/sherpa-onnx-wasm-main-asr.cc
查看文件 @8ab5cba
@@ -16,10 +16,12 @@ extern "C" {
 static_assert(sizeof(SherpaOnnxOnlineTransducerModelConfig) == 3 * 4, "");
 static_assert(sizeof(SherpaOnnxOnlineParaformerModelConfig) == 2 * 4, "");
 static_assert(sizeof(SherpaOnnxOnlineZipformer2CtcModelConfig) == 1 * 4, "");
+static_assert(sizeof(SherpaOnnxOnlineNemoCtcModelConfig) == 1 * 4, "");
 static_assert(sizeof(SherpaOnnxOnlineModelConfig) ==
                   sizeof(SherpaOnnxOnlineTransducerModelConfig) +
                       sizeof(SherpaOnnxOnlineParaformerModelConfig) +
-                      sizeof(SherpaOnnxOnlineZipformer2CtcModelConfig) + 9 * 4,
+                      sizeof(SherpaOnnxOnlineZipformer2CtcModelConfig) + 9 * 4 +
+                      sizeof(SherpaOnnxOnlineNemoCtcModelConfig),
               "");
 static_assert(sizeof(SherpaOnnxFeatureConfig) == 2 * 4, "");
 static_assert(sizeof(SherpaOnnxOnlineCtcFstDecoderConfig) == 2 * 4, "");
@@ -36,6 +38,7 @@ void MyPrint(SherpaOnnxOnlineRecognizerConfig *config) {
   auto transducer_model_config = &model_config->transducer;
   auto paraformer_model_config = &model_config->paraformer;
   auto ctc_model_config = &model_config->zipformer2_ctc;
+  auto nemo_ctc = &model_config->nemo_ctc;
   fprintf(stdout, "----------online transducer model config----------\n");
   fprintf(stdout, "encoder: %s\n", transducer_model_config->encoder);
@@ -46,8 +49,12 @@ void MyPrint(SherpaOnnxOnlineRecognizerConfig *config) {
   fprintf(stdout, "encoder: %s\n", paraformer_model_config->encoder);
   fprintf(stdout, "decoder: %s\n", paraformer_model_config->decoder);
-  fprintf(stdout, "----------online ctc model config----------\n");
+  fprintf(stdout, "----------online zipformer2 ctc model config----------\n");
   fprintf(stdout, "model: %s\n", ctc_model_config->model);
+
+  fprintf(stdout, "----------online nemo ctc model config----------\n");
+  fprintf(stdout, "model: %s\n", nemo_ctc->model);
+
   fprintf(stdout, "tokens: %s\n", model_config->tokens);
   fprintf(stdout, "num_threads: %d\n", model_config->num_threads);
   fprintf(stdout, "provider: %s\n", model_config->provider);
--- a/wasm/kws/sherpa-onnx-kws.js
查看文件 @8ab5cba
+++ b/wasm/kws/sherpa-onnx-kws.js
查看文件 @8ab5cba
@@ -73,9 +73,12 @@ function initModelConfig(config, Module) {
   const transducer =
       initSherpaOnnxOnlineTransducerModelConfig(config.transducer, Module);
   const paraformer_len = 2 * 4
-  const ctc_len = 1 * 4
+  const zipfomer2_ctc_len = 1 * 4
+  const nemo_ctc_len = 1 * 4
+
+  const len = transducer.len + paraformer_len + zipfomer2_ctc_len + 9 * 4 +
+      nemo_ctc_len;
-  const len = transducer.len + paraformer_len + ctc_len + 9 * 4;
   const ptr = Module._malloc(len);
   Module.HEAPU8.fill(0, ptr, ptr + len);
@@ -112,7 +115,7 @@ function initModelConfig(config, Module) {
   Module.stringToUTF8(config.tokensBuf || '', buffer + offset, tokensBufLen);
   offset += tokensBufLen;
-  offset = transducer.len + paraformer_len + ctc_len;
+  offset = transducer.len + paraformer_len + zipfomer2_ctc_len;
   Module.setValue(ptr + offset, buffer, 'i8*');  // tokens
   offset += 4;