Add non-streaming ASR APIs for node-addon-api (#868)

Fangjun Kuang · GitHub
Commit 697b9607687bb270667e7df0ede3a73af6b4bf68 697b9607 1 parent 384f96c4
.github/scripts/test-nodejs-addon-npm.sh
nodejs-addon-examples/README.md
nodejs-addon-examples/test_asr_non_streaming_nemo_ctc.js
nodejs-addon-examples/test_asr_non_streaming_paraformer.js
nodejs-addon-examples/test_asr_non_streaming_transducer.js
nodejs-addon-examples/test_asr_non_streaming_whisper.js
nodejs-addon-examples/test_asr_streaming_paraformer.js
nodejs-addon-examples/test_asr_streaming_paraformer_microphone.js
nodejs-addon-examples/test_vad_asr_non_streaming_nemo_ctc_microphone.js
nodejs-addon-examples/test_vad_asr_non_streaming_paraformer_microphone.js
nodejs-addon-examples/test_vad_asr_non_streaming_transducer_microphone.js
nodejs-addon-examples/test_vad_asr_non_streaming_whisper_microphone.js
scripts/node-addon-api/CMakeLists.txt
scripts/node-addon-api/lib/non-streaming-asr.js
scripts/node-addon-api/lib/sherpa-onnx.js
scripts/node-addon-api/src/non-streaming-asr.cc
scripts/node-addon-api/src/sherpa-onnx-node-addon-api.cc
scripts/node-addon-api/src/streaming-asr.cc
--- a/.github/scripts/test-nodejs-addon-npm.sh
查看文件 @697b960
+++ b/.github/scripts/test-nodejs-addon-npm.sh
查看文件 @697b960
@@ -22,5 +22,39 @@ node ./test_asr_streaming_ctc.js
 # To decode with HLG.fst
 node ./test_asr_streaming_ctc_hlg.js
-
 rm -rf sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18
+
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+tar xvf sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+rm sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+
+node ./test_asr_streaming_paraformer.js
+rm -rf sherpa-onnx-streaming-paraformer-bilingual-zh-en
+
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-zipformer-en-2023-04-01.tar.bz2
+tar xvf sherpa-onnx-zipformer-en-2023-04-01.tar.bz2
+rm sherpa-onnx-zipformer-en-2023-04-01.tar.bz2
+
+node ./test_asr_non_streaming_transducer.js
+rm -rf sherpa-onnx-zipformer-en-2023-04-01
+
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-whisper-tiny.en.tar.bz2
+tar xvf sherpa-onnx-whisper-tiny.en.tar.bz2
+rm sherpa-onnx-whisper-tiny.en.tar.bz2
+
+node ./test_asr_non_streaming_whisper.js
+rm -rf sherpa-onnx-whisper-tiny.en
+
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k.tar.bz2
+tar xvf sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k.tar.bz2
+rm sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k.tar.bz2
+
+node ./test_asr_non_streaming_nemo_ctc.js
+rm -rf sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k
+
+curl -SL -O https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-paraformer-zh-2023-03-28.tar.bz2
+tar xvf sherpa-onnx-paraformer-zh-2023-03-28.tar.bz2
+rm sherpa-onnx-paraformer-zh-2023-03-28.tar.bz2
+
+node ./test_asr_non_streaming_paraformer.js
+rm -rf sherpa-onnx-paraformer-zh-2023-03-28
--- a/nodejs-addon-examples/README.md
查看文件 @697b960
+++ b/nodejs-addon-examples/README.md
查看文件 @697b960
@@ -39,7 +39,7 @@ npm install naudiodon2
 node ./test_vad_microphone.js
 ```
-## Streaming speech recognition with zipformer transducer
+## Streaming speech recognition with Zipformer transducer
 ```bash
 wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20.tar.bz2
@@ -54,7 +54,7 @@ npm install naudiodon2
 node ./test_asr_streaming_transducer_microphone.js
 ```
-## Streaming speech recognition with zipformer CTC
+## Streaming speech recognition with Zipformer CTC
 ```bash
 wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-zipformer-ctc-small-2024-03-18.tar.bz2
@@ -72,3 +72,74 @@ npm install naudiodon2
 node ./test_asr_streaming_ctc_microphone.js
 node ./test_asr_streaming_ctc_hlg_microphone.js
 ```
+
+## Streaming speech recognition with Paraformer
+
+```bash
+wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+tar xvf sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+rm sherpa-onnx-streaming-paraformer-bilingual-zh-en.tar.bz2
+
+node ./test_asr_streaming_paraformer.js
+
+# To run the test with a microphone, you need to install the package naudiodon2
+npm install naudiodon2
+
+node ./test_asr_streaming_paraformer_microphone.js
+```
+
+## Non-streaming speech recognition with Zipformer transducer
+
+```bash
+wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-zipformer-en-2023-04-01.tar.bz2
+tar xvf sherpa-onnx-zipformer-en-2023-04-01.tar.bz2
+rm sherpa-onnx-zipformer-en-2023-04-01.tar.bz2
+
+node ./test_asr_non_streaming_transducer.js
+
+# To run VAD + non-streaming ASR with transudcer using a microphone
+npm install naudiodon2
+node ./test_vad_asr_non_streaming_transducer_microphone.js
+```
+
+## Non-streaming speech recognition with Whisper
+
+```bash
+wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-whisper-tiny.en.tar.bz2
+tar xvf sherpa-onnx-whisper-tiny.en.tar.bz2
+rm sherpa-onnx-whisper-tiny.en.tar.bz2
+
+node ./test_asr_non_streaming_whisper.js
+
+# To run VAD + non-streaming ASR with Paraformer using a microphone
+npm install naudiodon2
+node ./test_vad_asr_non_streaming_whisper_microphone.js
+```
+
+## Non-streaming speech recognition with NeMo CTC models
+
+```bash
+wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k.tar.bz2
+tar xvf sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k.tar.bz2
+rm sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k.tar.bz2
+
+node ./test_asr_non_streaming_nemo_ctc.js
+
+# To run VAD + non-streaming ASR with Paraformer using a microphone
+npm install naudiodon2
+node ./test_vad_asr_non_streaming_nemo_ctc_microphone.js
+```
+
+## Non-streaming speech recognition with Paraformer
+
+```bash
+wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-paraformer-zh-2023-03-28.tar.bz2
+tar xvf sherpa-onnx-paraformer-zh-2023-03-28.tar.bz2
+rm sherpa-onnx-paraformer-zh-2023-03-28.tar.bz2
+
+node ./test_asr_non_streaming_paraformer.js
+
+# To run VAD + non-streaming ASR with Paraformer using a microphone
+npm install naudiodon2
+node ./test_vad_asr_non_streaming_paraformer_microphone.js
+```
--- a/nodejs-addon-examples/test_asr_non_streaming_nemo_ctc.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_asr_non_streaming_nemo_ctc.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2024  Xiaomi Corporation
+const sherpa_onnx = require('sherpa-onnx-node');
+const performance = require('perf_hooks').performance;
+
+
+// Please download test files from
+// https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+const config = {
+  'featConfig': {
+    'sampleRate': 16000,
+    'featureDim': 80,
+  },
+  'modelConfig': {
+    'nemoCtc': {
+      'model':
+          './sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k/model.onnx',
+    },
+    'tokens':
+        './sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k/tokens.txt',
+    'numThreads': 2,
+    'provider': 'cpu',
+    'debug': 1,
+  }
+};
+
+const waveFilename =
+    './sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k/test_wavs/de-german.wav';
+
+const recognizer = new sherpa_onnx.OfflineRecognizer(config);
+console.log('Started')
+let start = performance.now();
+const stream = recognizer.createStream();
+const wave = sherpa_onnx.readWave(waveFilename);
+stream.acceptWaveform({sampleRate: wave.sampleRate, samples: wave.samples});
+
+recognizer.decode(stream);
+result = recognizer.getResult(stream)
+let stop = performance.now();
+console.log('Done')
+
+const elapsed_seconds = (stop - start) / 1000;
+const duration = wave.samples.length / wave.sampleRate;
+const real_time_factor = elapsed_seconds / duration;
+console.log('Wave duration', duration.toFixed(3), 'secodns')
+console.log('Elapsed', elapsed_seconds.toFixed(3), 'secodns')
+console.log(
+    `RTF = ${elapsed_seconds.toFixed(3)}/${duration.toFixed(3)} =`,
+    real_time_factor.toFixed(3))
+console.log(waveFilename)
+console.log('result\n', result)
--- a/nodejs-addon-examples/test_asr_non_streaming_paraformer.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_asr_non_streaming_paraformer.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2024  Xiaomi Corporation
+const sherpa_onnx = require('sherpa-onnx-node');
+const performance = require('perf_hooks').performance;
+
+
+// Please download test files from
+// https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+const config = {
+  'featConfig': {
+    'sampleRate': 16000,
+    'featureDim': 80,
+  },
+  'modelConfig': {
+    'paraformer': {
+      'model': './sherpa-onnx-paraformer-zh-2023-03-28/model.int8.onnx',
+    },
+    'tokens': './sherpa-onnx-paraformer-zh-2023-03-28/tokens.txt',
+    'numThreads': 2,
+    'provider': 'cpu',
+    'debug': 1,
+  }
+};
+
+const waveFilename =
+    './sherpa-onnx-paraformer-zh-2023-03-28/test_wavs/5-henan.wav';
+
+const recognizer = new sherpa_onnx.OfflineRecognizer(config);
+console.log('Started')
+let start = performance.now();
+const stream = recognizer.createStream();
+const wave = sherpa_onnx.readWave(waveFilename);
+stream.acceptWaveform({sampleRate: wave.sampleRate, samples: wave.samples});
+
+recognizer.decode(stream);
+result = recognizer.getResult(stream)
+let stop = performance.now();
+console.log('Done')
+
+const elapsed_seconds = (stop - start) / 1000;
+const duration = wave.samples.length / wave.sampleRate;
+const real_time_factor = elapsed_seconds / duration;
+console.log('Wave duration', duration.toFixed(3), 'secodns')
+console.log('Elapsed', elapsed_seconds.toFixed(3), 'secodns')
+console.log(
+    `RTF = ${elapsed_seconds.toFixed(3)}/${duration.toFixed(3)} =`,
+    real_time_factor.toFixed(3))
+console.log(waveFilename)
+console.log('result\n', result)
--- a/nodejs-addon-examples/test_asr_non_streaming_transducer.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_asr_non_streaming_transducer.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2024  Xiaomi Corporation
+const sherpa_onnx = require('sherpa-onnx-node');
+const performance = require('perf_hooks').performance;
+
+
+// Please download test files from
+// https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+const config = {
+  'featConfig': {
+    'sampleRate': 16000,
+    'featureDim': 80,
+  },
+  'modelConfig': {
+    'transducer': {
+      'encoder':
+          './sherpa-onnx-zipformer-en-2023-04-01/encoder-epoch-99-avg-1.int8.onnx',
+      'decoder':
+          './sherpa-onnx-zipformer-en-2023-04-01/decoder-epoch-99-avg-1.onnx',
+      'joiner':
+          './sherpa-onnx-zipformer-en-2023-04-01/joiner-epoch-99-avg-1.int8.onnx',
+    },
+    'tokens': './sherpa-onnx-zipformer-en-2023-04-01/tokens.txt',
+    'numThreads': 2,
+    'provider': 'cpu',
+    'debug': 1,
+  }
+};
+
+const waveFilename = './sherpa-onnx-zipformer-en-2023-04-01/test_wavs/1.wav';
+
+const recognizer = new sherpa_onnx.OfflineRecognizer(config);
+console.log('Started')
+let start = performance.now();
+const stream = recognizer.createStream();
+const wave = sherpa_onnx.readWave(waveFilename);
+stream.acceptWaveform({sampleRate: wave.sampleRate, samples: wave.samples});
+
+recognizer.decode(stream);
+result = recognizer.getResult(stream)
+let stop = performance.now();
+console.log('Done')
+
+const elapsed_seconds = (stop - start) / 1000;
+const duration = wave.samples.length / wave.sampleRate;
+const real_time_factor = elapsed_seconds / duration;
+console.log('Wave duration', duration.toFixed(3), 'secodns')
+console.log('Elapsed', elapsed_seconds.toFixed(3), 'secodns')
+console.log(
+    `RTF = ${elapsed_seconds.toFixed(3)}/${duration.toFixed(3)} =`,
+    real_time_factor.toFixed(3))
+console.log(waveFilename)
+console.log('result\n', result)
--- a/nodejs-addon-examples/test_asr_non_streaming_whisper.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_asr_non_streaming_whisper.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2024  Xiaomi Corporation
+const sherpa_onnx = require('sherpa-onnx-node');
+const performance = require('perf_hooks').performance;
+
+
+// Please download test files from
+// https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+const config = {
+  'featConfig': {
+    'sampleRate': 16000,
+    'featureDim': 80,
+  },
+  'modelConfig': {
+    'whisper': {
+      'encoder': './sherpa-onnx-whisper-tiny.en/tiny.en-encoder.int8.onnx',
+      'decoder': './sherpa-onnx-whisper-tiny.en/tiny.en-decoder.int8.onnx',
+    },
+    'tokens': './sherpa-onnx-whisper-tiny.en/tiny.en-tokens.txt',
+    'numThreads': 2,
+    'provider': 'cpu',
+    'debug': 1,
+  }
+};
+
+const waveFilename = './sherpa-onnx-whisper-tiny.en/test_wavs/0.wav';
+
+const recognizer = new sherpa_onnx.OfflineRecognizer(config);
+console.log('Started')
+let start = performance.now();
+const stream = recognizer.createStream();
+const wave = sherpa_onnx.readWave(waveFilename);
+stream.acceptWaveform({sampleRate: wave.sampleRate, samples: wave.samples});
+
+recognizer.decode(stream);
+result = recognizer.getResult(stream)
+let stop = performance.now();
+console.log('Done')
+
+const elapsed_seconds = (stop - start) / 1000;
+const duration = wave.samples.length / wave.sampleRate;
+const real_time_factor = elapsed_seconds / duration;
+console.log('Wave duration', duration.toFixed(3), 'secodns')
+console.log('Elapsed', elapsed_seconds.toFixed(3), 'secodns')
+console.log(
+    `RTF = ${elapsed_seconds.toFixed(3)}/${duration.toFixed(3)} =`,
+    real_time_factor.toFixed(3))
+console.log(waveFilename)
+console.log('result\n', result)
--- a/nodejs-addon-examples/test_asr_streaming_paraformer.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_asr_streaming_paraformer.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2024  Xiaomi Corporation
+const sherpa_onnx = require('sherpa-onnx-node');
+const performance = require('perf_hooks').performance;
+
+
+// Please download test files from
+// https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+const config = {
+  'featConfig': {
+    'sampleRate': 16000,
+    'featureDim': 80,
+  },
+  'modelConfig': {
+    'paraformer': {
+      'encoder':
+          './sherpa-onnx-streaming-paraformer-bilingual-zh-en/encoder.int8.onnx',
+      'decoder':
+          './sherpa-onnx-streaming-paraformer-bilingual-zh-en/decoder.int8.onnx',
+    },
+    'tokens': './sherpa-onnx-streaming-paraformer-bilingual-zh-en/tokens.txt',
+    'numThreads': 2,
+    'provider': 'cpu',
+    'debug': 1,
+  }
+};
+
+const waveFilename =
+    './sherpa-onnx-streaming-paraformer-bilingual-zh-en/test_wavs/0.wav';
+
+const recognizer = new sherpa_onnx.OnlineRecognizer(config);
+console.log('Started')
+let start = performance.now();
+const stream = recognizer.createStream();
+const wave = sherpa_onnx.readWave(waveFilename);
+stream.acceptWaveform({sampleRate: wave.sampleRate, samples: wave.samples});
+
+const tailPadding = new Float32Array(wave.sampleRate * 0.4);
+stream.acceptWaveform({samples: tailPadding, sampleRate: wave.sampleRate});
+
+while (recognizer.isReady(stream)) {
+  recognizer.decode(stream);
+}
+result = recognizer.getResult(stream)
+let stop = performance.now();
+console.log('Done')
+
+const elapsed_seconds = (stop - start) / 1000;
+const duration = wave.samples.length / wave.sampleRate;
+const real_time_factor = elapsed_seconds / duration;
+console.log('Wave duration', duration.toFixed(3), 'secodns')
+console.log('Elapsed', elapsed_seconds.toFixed(3), 'secodns')
+console.log(
+    `RTF = ${elapsed_seconds.toFixed(3)}/${duration.toFixed(3)} =`,
+    real_time_factor.toFixed(3))
+console.log(waveFilename)
+console.log('result\n', result)
--- a/nodejs-addon-examples/test_asr_streaming_paraformer_microphone.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_asr_streaming_paraformer_microphone.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2023-2024  Xiaomi Corporation (authors: Fangjun Kuang)
+//
+const portAudio = require('naudiodon2');
+// console.log(portAudio.getDevices());
+
+const sherpa_onnx = require('sherpa-onnx-node');
+
+function createOnlineRecognizer() {
+  const config = {
+    'featConfig': {
+      'sampleRate': 16000,
+      'featureDim': 80,
+    },
+    'modelConfig': {
+      'paraformer': {
+        'encoder':
+            './sherpa-onnx-streaming-paraformer-bilingual-zh-en/encoder.int8.onnx',
+        'decoder':
+            './sherpa-onnx-streaming-paraformer-bilingual-zh-en/decoder.int8.onnx',
+      },
+      'tokens': './sherpa-onnx-streaming-paraformer-bilingual-zh-en/tokens.txt',
+      'numThreads': 2,
+      'provider': 'cpu',
+      'debug': 1,
+    },
+    'decodingMethod': 'greedy_search',
+    'maxActivePaths': 4,
+    'enableEndpoint': true,
+    'rule1MinTrailingSilence': 2.4,
+    'rule2MinTrailingSilence': 1.2,
+    'rule3MinUtteranceLength': 20
+  };
+
+  return new sherpa_onnx.OnlineRecognizer(config);
+}
+
+const recognizer = createOnlineRecognizer();
+const stream = recognizer.createStream();
+
+let lastText = '';
+let segmentIndex = 0;
+
+const ai = new portAudio.AudioIO({
+  inOptions: {
+    channelCount: 1,
+    closeOnError: true,  // Close the stream if an audio error is detected, if
+                         // set false then just log the error
+    deviceId: -1,  // Use -1 or omit the deviceId to select the default device
+    sampleFormat: portAudio.SampleFormatFloat32,
+    sampleRate: recognizer.config.featConfig.sampleRate
+  }
+});
+
+const display = new sherpa_onnx.Display(50);
+
+ai.on('data', data => {
+  const samples = new Float32Array(data.buffer);
+
+  stream.acceptWaveform(
+      {sampleRate: recognizer.config.featConfig.sampleRate, samples: samples});
+
+  while (recognizer.isReady(stream)) {
+    recognizer.decode(stream);
+  }
+
+  const isEndpoint = recognizer.isEndpoint(stream);
+  let text = recognizer.getResult(stream).text.toLowerCase();
+
+  if (isEndpoint) {
+    // for online paraformer models, we have to manually padding on endpoint
+    // so that the last word can be recognized
+    const tailPadding =
+        new Float32Array(recognizer.config.featConfig.sampleRate * 0.4);
+    stream.acceptWaveform({
+      samples: tailPadding,
+      sampleRate: recognizer.config.featConfig.sampleRate
+    });
+    while (recognizer.isReady(stream)) {
+      recognizer.decode(stream);
+    }
+    text = recognizer.getResult(stream).text.toLowerCase();
+  }
+
+  if (text.length > 0 && lastText != text) {
+    lastText = text;
+    display.print(segmentIndex, lastText);
+  }
+  if (isEndpoint) {
+    if (text.length > 0) {
+      lastText = text;
+      segmentIndex += 1;
+    }
+    recognizer.reset(stream)
+  }
+});
+
+ai.on('close', () => {
+  console.log('Free resources');
+  stream.free();
+  recognizer.free();
+});
+
+ai.start();
+console.log('Started! Please speak')
--- a/nodejs-addon-examples/test_vad_asr_non_streaming_nemo_ctc_microphone.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_vad_asr_non_streaming_nemo_ctc_microphone.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2023-2024  Xiaomi Corporation (authors: Fangjun Kuang)
+//
+const portAudio = require('naudiodon2');
+// console.log(portAudio.getDevices());
+
+const sherpa_onnx = require('sherpa-onnx-node');
+
+function createRecognizer() {
+  // Please download test files from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+  const config = {
+    'featConfig': {
+      'sampleRate': 16000,
+      'featureDim': 80,
+    },
+    'modelConfig': {
+      'nemoCtc': {
+        'model':
+            './sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k/model.onnx',
+      },
+      'tokens':
+          './sherpa-onnx-nemo-fast-conformer-ctc-be-de-en-es-fr-hr-it-pl-ru-uk-20k/tokens.txt',
+      'numThreads': 2,
+      'provider': 'cpu',
+      'debug': 1,
+    }
+  };
+
+  return new sherpa_onnx.OfflineRecognizer(config);
+}
+
+function createVad() {
+  // please download silero_vad.onnx from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/silero_vad.onnx
+  const config = {
+    sileroVad: {
+      model: './silero_vad.onnx',
+      threshold: 0.5,
+      minSpeechDuration: 0.25,
+      minSilenceDuration: 0.5,
+      windowSize: 512,
+    },
+    sampleRate: 16000,
+    debug: true,
+    numThreads: 1,
+  };
+
+  const bufferSizeInSeconds = 60;
+
+  return new sherpa_onnx.Vad(config, bufferSizeInSeconds);
+}
+
+const recognizer = createRecognizer();
+const vad = createVad();
+
+const bufferSizeInSeconds = 30;
+const buffer =
+    new sherpa_onnx.CircularBuffer(bufferSizeInSeconds * vad.config.sampleRate);
+
+const ai = new portAudio.AudioIO({
+  inOptions: {
+    channelCount: 1,
+    closeOnError: true,  // Close the stream if an audio error is detected, if
+                         // set false then just log the error
+    deviceId: -1,  // Use -1 or omit the deviceId to select the default device
+    sampleFormat: portAudio.SampleFormatFloat32,
+    sampleRate: vad.config.sampleRate
+  }
+});
+
+let printed = false;
+let index = 0;
+ai.on('data', data => {
+  const windowSize = vad.config.sileroVad.windowSize;
+  buffer.push(new Float32Array(data.buffer));
+  while (buffer.size() > windowSize) {
+    const samples = buffer.get(buffer.head(), windowSize);
+    buffer.pop(windowSize);
+    vad.acceptWaveform(samples);
+  }
+
+  while (!vad.isEmpty()) {
+    const segment = vad.front();
+    vad.pop();
+    const stream = recognizer.createStream();
+    stream.acceptWaveform({
+      samples: segment.samples,
+      sampleRate: recognizer.config.featConfig.sampleRate
+    });
+    recognizer.decode(stream);
+    const r = recognizer.getResult(stream);
+    if (r.text.length > 0) {
+      const text = r.text.toLowerCase().trim();
+      console.log(`${index}: ${text}`);
+
+      const filename = `${index}-${text}-${
+          new Date()
+              .toLocaleTimeString('en-US', {hour12: false})
+              .split(' ')[0]}.wav`;
+      sherpa_onnx.writeWave(
+          filename,
+          {samples: segment.samples, sampleRate: vad.config.sampleRate})
+
+      index += 1;
+    }
+  }
+});
+
+ai.start();
+console.log('Started! Please speak')
--- a/nodejs-addon-examples/test_vad_asr_non_streaming_paraformer_microphone.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_vad_asr_non_streaming_paraformer_microphone.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2023-2024  Xiaomi Corporation (authors: Fangjun Kuang)
+//
+const portAudio = require('naudiodon2');
+// console.log(portAudio.getDevices());
+
+const sherpa_onnx = require('sherpa-onnx-node');
+
+function createRecognizer() {
+  // Please download test files from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+  const config = {
+    'featConfig': {
+      'sampleRate': 16000,
+      'featureDim': 80,
+    },
+    'modelConfig': {
+      'paraformer': {
+        'model': './sherpa-onnx-paraformer-zh-2023-03-28/model.int8.onnx',
+      },
+      'tokens': './sherpa-onnx-paraformer-zh-2023-03-28/tokens.txt',
+      'numThreads': 2,
+      'provider': 'cpu',
+      'debug': 1,
+    }
+  };
+
+  return new sherpa_onnx.OfflineRecognizer(config);
+}
+
+function createVad() {
+  // please download silero_vad.onnx from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/silero_vad.onnx
+  const config = {
+    sileroVad: {
+      model: './silero_vad.onnx',
+      threshold: 0.5,
+      minSpeechDuration: 0.25,
+      minSilenceDuration: 0.5,
+      windowSize: 512,
+    },
+    sampleRate: 16000,
+    debug: true,
+    numThreads: 1,
+  };
+
+  const bufferSizeInSeconds = 60;
+
+  return new sherpa_onnx.Vad(config, bufferSizeInSeconds);
+}
+
+const recognizer = createRecognizer();
+const vad = createVad();
+
+const bufferSizeInSeconds = 30;
+const buffer =
+    new sherpa_onnx.CircularBuffer(bufferSizeInSeconds * vad.config.sampleRate);
+
+const ai = new portAudio.AudioIO({
+  inOptions: {
+    channelCount: 1,
+    closeOnError: true,  // Close the stream if an audio error is detected, if
+                         // set false then just log the error
+    deviceId: -1,  // Use -1 or omit the deviceId to select the default device
+    sampleFormat: portAudio.SampleFormatFloat32,
+    sampleRate: vad.config.sampleRate
+  }
+});
+
+let printed = false;
+let index = 0;
+ai.on('data', data => {
+  const windowSize = vad.config.sileroVad.windowSize;
+  buffer.push(new Float32Array(data.buffer));
+  while (buffer.size() > windowSize) {
+    const samples = buffer.get(buffer.head(), windowSize);
+    buffer.pop(windowSize);
+    vad.acceptWaveform(samples);
+  }
+
+  while (!vad.isEmpty()) {
+    const segment = vad.front();
+    vad.pop();
+    const stream = recognizer.createStream();
+    stream.acceptWaveform({
+      samples: segment.samples,
+      sampleRate: recognizer.config.featConfig.sampleRate
+    });
+    recognizer.decode(stream);
+    const r = recognizer.getResult(stream);
+    if (r.text.length > 0) {
+      const text = r.text.toLowerCase().trim();
+      console.log(`${index}: ${text}`);
+
+      const filename = `${index}-${text}-${
+          new Date()
+              .toLocaleTimeString('en-US', {hour12: false})
+              .split(' ')[0]}.wav`;
+      sherpa_onnx.writeWave(
+          filename,
+          {samples: segment.samples, sampleRate: vad.config.sampleRate})
+
+      index += 1;
+    }
+  }
+});
+
+ai.start();
+console.log('Started! Please speak')
--- a/nodejs-addon-examples/test_vad_asr_non_streaming_transducer_microphone.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_vad_asr_non_streaming_transducer_microphone.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2023-2024  Xiaomi Corporation (authors: Fangjun Kuang)
+//
+const portAudio = require('naudiodon2');
+// console.log(portAudio.getDevices());
+
+const sherpa_onnx = require('sherpa-onnx-node');
+
+function createRecognizer() {
+  // Please download test files from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+  const config = {
+    'featConfig': {
+      'sampleRate': 16000,
+      'featureDim': 80,
+    },
+    'modelConfig': {
+      'transducer': {
+        'encoder':
+            './sherpa-onnx-zipformer-en-2023-04-01/encoder-epoch-99-avg-1.int8.onnx',
+        'decoder':
+            './sherpa-onnx-zipformer-en-2023-04-01/decoder-epoch-99-avg-1.onnx',
+        'joiner':
+            './sherpa-onnx-zipformer-en-2023-04-01/joiner-epoch-99-avg-1.int8.onnx',
+      },
+      'tokens': './sherpa-onnx-zipformer-en-2023-04-01/tokens.txt',
+      'numThreads': 2,
+      'provider': 'cpu',
+      'debug': 1,
+    }
+  };
+
+  return new sherpa_onnx.OfflineRecognizer(config);
+}
+
+function createVad() {
+  // please download silero_vad.onnx from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/silero_vad.onnx
+  const config = {
+    sileroVad: {
+      model: './silero_vad.onnx',
+      threshold: 0.5,
+      minSpeechDuration: 0.25,
+      minSilenceDuration: 0.5,
+      windowSize: 512,
+    },
+    sampleRate: 16000,
+    debug: true,
+    numThreads: 1,
+  };
+
+  const bufferSizeInSeconds = 60;
+
+  return new sherpa_onnx.Vad(config, bufferSizeInSeconds);
+}
+
+const recognizer = createRecognizer();
+const vad = createVad();
+
+const bufferSizeInSeconds = 30;
+const buffer =
+    new sherpa_onnx.CircularBuffer(bufferSizeInSeconds * vad.config.sampleRate);
+
+const ai = new portAudio.AudioIO({
+  inOptions: {
+    channelCount: 1,
+    closeOnError: true,  // Close the stream if an audio error is detected, if
+                         // set false then just log the error
+    deviceId: -1,  // Use -1 or omit the deviceId to select the default device
+    sampleFormat: portAudio.SampleFormatFloat32,
+    sampleRate: vad.config.sampleRate
+  }
+});
+
+let printed = false;
+let index = 0;
+ai.on('data', data => {
+  const windowSize = vad.config.sileroVad.windowSize;
+  buffer.push(new Float32Array(data.buffer));
+  while (buffer.size() > windowSize) {
+    const samples = buffer.get(buffer.head(), windowSize);
+    buffer.pop(windowSize);
+    vad.acceptWaveform(samples);
+  }
+
+  while (!vad.isEmpty()) {
+    const segment = vad.front();
+    vad.pop();
+    const stream = recognizer.createStream();
+    stream.acceptWaveform({
+      samples: segment.samples,
+      sampleRate: recognizer.config.featConfig.sampleRate
+    });
+    recognizer.decode(stream);
+    const r = recognizer.getResult(stream);
+    if (r.text.length > 0) {
+      const text = r.text.toLowerCase().trim();
+      console.log(`${index}: ${text}`);
+
+      const filename = `${index}-${text}-${
+          new Date()
+              .toLocaleTimeString('en-US', {hour12: false})
+              .split(' ')[0]}.wav`;
+      sherpa_onnx.writeWave(
+          filename,
+          {samples: segment.samples, sampleRate: vad.config.sampleRate})
+
+      index += 1;
+    }
+  }
+});
+
+ai.start();
+console.log('Started! Please speak')
--- a/nodejs-addon-examples/test_vad_asr_non_streaming_whisper_microphone.js 0 → 100644
查看文件 @697b960
+++ b/nodejs-addon-examples/test_vad_asr_non_streaming_whisper_microphone.js 0 → 100644
查看文件 @697b960
+// Copyright (c)  2023-2024  Xiaomi Corporation (authors: Fangjun Kuang)
+//
+const portAudio = require('naudiodon2');
+// console.log(portAudio.getDevices());
+
+const sherpa_onnx = require('sherpa-onnx-node');
+
+function createRecognizer() {
+  // Please download test files from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models
+  const config = {
+    'featConfig': {
+      'sampleRate': 16000,
+      'featureDim': 80,
+    },
+    'modelConfig': {
+      'whisper': {
+        'encoder': './sherpa-onnx-whisper-tiny.en/tiny.en-encoder.int8.onnx',
+        'decoder': './sherpa-onnx-whisper-tiny.en/tiny.en-decoder.int8.onnx',
+      },
+      'tokens': './sherpa-onnx-whisper-tiny.en/tiny.en-tokens.txt',
+      'numThreads': 2,
+      'provider': 'cpu',
+      'debug': 1,
+    }
+  };
+
+  return new sherpa_onnx.OfflineRecognizer(config);
+}
+
+function createVad() {
+  // please download silero_vad.onnx from
+  // https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/silero_vad.onnx
+  const config = {
+    sileroVad: {
+      model: './silero_vad.onnx',
+      threshold: 0.5,
+      minSpeechDuration: 0.25,
+      minSilenceDuration: 0.5,
+      windowSize: 512,
+    },
+    sampleRate: 16000,
+    debug: true,
+    numThreads: 1,
+  };
+
+  const bufferSizeInSeconds = 60;
+
+  return new sherpa_onnx.Vad(config, bufferSizeInSeconds);
+}
+
+const recognizer = createRecognizer();
+const vad = createVad();
+
+const bufferSizeInSeconds = 30;
+const buffer =
+    new sherpa_onnx.CircularBuffer(bufferSizeInSeconds * vad.config.sampleRate);
+
+const ai = new portAudio.AudioIO({
+  inOptions: {
+    channelCount: 1,
+    closeOnError: true,  // Close the stream if an audio error is detected, if
+                         // set false then just log the error
+    deviceId: -1,  // Use -1 or omit the deviceId to select the default device
+    sampleFormat: portAudio.SampleFormatFloat32,
+    sampleRate: vad.config.sampleRate
+  }
+});
+
+let printed = false;
+let index = 0;
+ai.on('data', data => {
+  const windowSize = vad.config.sileroVad.windowSize;
+  buffer.push(new Float32Array(data.buffer));
+  while (buffer.size() > windowSize) {
+    const samples = buffer.get(buffer.head(), windowSize);
+    buffer.pop(windowSize);
+    vad.acceptWaveform(samples);
+  }
+
+  while (!vad.isEmpty()) {
+    const segment = vad.front();
+    vad.pop();
+    const stream = recognizer.createStream();
+    stream.acceptWaveform({
+      samples: segment.samples,
+      sampleRate: recognizer.config.featConfig.sampleRate
+    });
+    recognizer.decode(stream);
+    const r = recognizer.getResult(stream);
+    if (r.text.length > 0) {
+      const text = r.text.toLowerCase().trim();
+      console.log(`${index}: ${text}`);
+
+      const filename = `${index}-${text}-${
+          new Date()
+              .toLocaleTimeString('en-US', {hour12: false})
+              .split(' ')[0]}.wav`;
+      sherpa_onnx.writeWave(
+          filename,
+          {samples: segment.samples, sampleRate: vad.config.sampleRate})
+
+      index += 1;
+    }
+  }
+});
+
+ai.start();
+console.log('Started! Please speak')
--- a/scripts/node-addon-api/CMakeLists.txt
查看文件 @697b960
+++ b/scripts/node-addon-api/CMakeLists.txt
查看文件 @697b960
@@ -18,6 +18,7 @@ add_definitions(-DNAPI_VERSION=3)
 include_directories(${CMAKE_JS_INC})
 set(srcs
+  src/non-streaming-asr.cc
   src/sherpa-onnx-node-addon-api.cc
   src/streaming-asr.cc
   src/vad.cc
--- a/scripts/node-addon-api/lib/non-streaming-asr.js 0 → 100644
查看文件 @697b960
+++ b/scripts/node-addon-api/lib/non-streaming-asr.js 0 → 100644
查看文件 @697b960
+const addon = require('./addon.js');
+
+class OfflineStream {
+  constructor(handle) {
+    this.handle = handle;
+  }
+
+  // obj is {samples: samples, sampleRate: sampleRate}
+  // samples is a float32 array containing samples in the range [-1, 1]
+  // sampleRate is a number
+  acceptWaveform(obj) {
+    addon.acceptWaveformOffline(this.handle, obj)
+  }
+}
+
+class OfflineRecognizer {
+  constructor(config) {
+    this.handle = addon.createOfflineRecognizer(config);
+    this.config = config
+  }
+
+  createStream() {
+    const handle = addon.createOfflineStream(this.handle);
+    return new OfflineStream(handle);
+  }
+
+  decode(stream) {
+    addon.decodeOfflineStream(this.handle, stream.handle);
+  }
+
+  getResult(stream) {
+    const jsonStr = addon.getOfflineStreamResultAsJson(stream.handle);
+
+    return JSON.parse(jsonStr);
+  }
+}
+
+module.exports = {
+  OfflineRecognizer,
+}
--- a/scripts/node-addon-api/lib/sherpa-onnx.js
查看文件 @697b960
+++ b/scripts/node-addon-api/lib/sherpa-onnx.js
查看文件 @697b960
 const addon = require('./addon.js')
 const streaming_asr = require('./streaming-asr.js');
+const non_streaming_asr = require('./non-streaming-asr.js');
 const vad = require('./vad.js');
 module.exports = {
   OnlineRecognizer: streaming_asr.OnlineRecognizer,
+  OfflineRecognizer: non_streaming_asr.OfflineRecognizer,
   readWave: addon.readWave,
   writeWave: addon.writeWave,
   Display: streaming_asr.Display,
--- a/scripts/node-addon-api/src/non-streaming-asr.cc 0 → 100644
查看文件 @697b960
+++ b/scripts/node-addon-api/src/non-streaming-asr.cc 0 → 100644
查看文件 @697b960
+// scripts/node-addon-api/src/non-streaming-asr.cc
+//
+// Copyright (c)  2024  Xiaomi Corporation
+#include <sstream>
+
+#include "napi.h"  // NOLINT
+#include "sherpa-onnx/c-api/c-api.h"
+
+// defined in ./streaming-asr.cc
+SherpaOnnxFeatureConfig GetFeatureConfig(Napi::Object obj);
+
+static SherpaOnnxOfflineTransducerModelConfig GetOfflineTransducerModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOfflineTransducerModelConfig config;
+  memset(&config, 0, sizeof(config));
+
+  if (!obj.Has("transducer") || !obj.Get("transducer").IsObject()) {
+    return config;
+  }
+
+  Napi::Object o = obj.Get("transducer").As<Napi::Object>();
+
+  if (o.Has("encoder") && o.Get("encoder").IsString()) {
+    Napi::String encoder = o.Get("encoder").As<Napi::String>();
+    std::string s = encoder.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.encoder = p;
+  }
+
+  if (o.Has("decoder") && o.Get("decoder").IsString()) {
+    Napi::String decoder = o.Get("decoder").As<Napi::String>();
+    std::string s = decoder.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.decoder = p;
+  }
+
+  if (o.Has("joiner") && o.Get("joiner").IsString()) {
+    Napi::String joiner = o.Get("joiner").As<Napi::String>();
+    std::string s = joiner.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.joiner = p;
+  }
+
+  return config;
+}
+
+static SherpaOnnxOfflineParaformerModelConfig GetOfflineParaformerModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOfflineParaformerModelConfig config;
+  memset(&config, 0, sizeof(config));
+
+  if (!obj.Has("paraformer") || !obj.Get("paraformer").IsObject()) {
+    return config;
+  }
+
+  Napi::Object o = obj.Get("paraformer").As<Napi::Object>();
+
+  if (o.Has("model") && o.Get("model").IsString()) {
+    Napi::String model = o.Get("model").As<Napi::String>();
+    std::string s = model.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.model = p;
+  }
+
+  return config;
+}
+
+static SherpaOnnxOfflineNemoEncDecCtcModelConfig GetOfflineNeMoCtcModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOfflineNemoEncDecCtcModelConfig config;
+  memset(&config, 0, sizeof(config));
+
+  if (!obj.Has("nemoCtc") || !obj.Get("nemoCtc").IsObject()) {
+    return config;
+  }
+
+  Napi::Object o = obj.Get("nemoCtc").As<Napi::Object>();
+
+  if (o.Has("model") && o.Get("model").IsString()) {
+    Napi::String model = o.Get("model").As<Napi::String>();
+    std::string s = model.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.model = p;
+  }
+
+  return config;
+}
+
+static SherpaOnnxOfflineWhisperModelConfig GetOfflineWhisperModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOfflineWhisperModelConfig config;
+  memset(&config, 0, sizeof(config));
+
+  if (!obj.Has("whisper") || !obj.Get("whisper").IsObject()) {
+    return config;
+  }
+
+  Napi::Object o = obj.Get("whisper").As<Napi::Object>();
+
+  if (o.Has("encoder") && o.Get("encoder").IsString()) {
+    Napi::String encoder = o.Get("encoder").As<Napi::String>();
+    std::string s = encoder.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.encoder = p;
+  }
+
+  if (o.Has("decoder") && o.Get("decoder").IsString()) {
+    Napi::String decoder = o.Get("decoder").As<Napi::String>();
+    std::string s = decoder.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.decoder = p;
+  }
+
+  if (o.Has("language") && o.Get("language").IsString()) {
+    Napi::String language = o.Get("language").As<Napi::String>();
+    std::string s = language.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.language = p;
+  }
+
+  if (o.Has("task") && o.Get("task").IsString()) {
+    Napi::String task = o.Get("task").As<Napi::String>();
+    std::string s = task.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.task = p;
+  }
+
+  return config;
+}
+
+static SherpaOnnxOfflineTdnnModelConfig GetOfflineTdnnModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOfflineTdnnModelConfig config;
+  memset(&config, 0, sizeof(config));
+
+  if (!obj.Has("tdnn") || !obj.Get("tdnn").IsObject()) {
+    return config;
+  }
+
+  Napi::Object o = obj.Get("tdnn").As<Napi::Object>();
+
+  if (o.Has("model") && o.Get("model").IsString()) {
+    Napi::String model = o.Get("model").As<Napi::String>();
+    std::string s = model.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.model = p;
+  }
+
+  return config;
+}
+
+static SherpaOnnxOfflineModelConfig GetOfflineModelConfig(Napi::Object obj) {
+  SherpaOnnxOfflineModelConfig c;
+  memset(&c, 0, sizeof(c));
+
+  if (!obj.Has("modelConfig") || !obj.Get("modelConfig").IsObject()) {
+    return c;
+  }
+
+  Napi::Object o = obj.Get("modelConfig").As<Napi::Object>();
+
+  c.transducer = GetOfflineTransducerModelConfig(o);
+  c.paraformer = GetOfflineParaformerModelConfig(o);
+  c.nemo_ctc = GetOfflineNeMoCtcModelConfig(o);
+  c.whisper = GetOfflineWhisperModelConfig(o);
+  c.tdnn = GetOfflineTdnnModelConfig(o);
+
+  if (o.Has("tokens") && o.Get("tokens").IsString()) {
+    Napi::String tokens = o.Get("tokens").As<Napi::String>();
+    std::string s = tokens.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    c.tokens = p;
+  }
+
+  if (o.Has("numThreads") && o.Get("numThreads").IsNumber()) {
+    c.num_threads = o.Get("numThreads").As<Napi::Number>().Int32Value();
+  }
+
+  if (o.Has("debug") &&
+      (o.Get("debug").IsNumber() || o.Get("debug").IsBoolean())) {
+    if (o.Get("debug").IsBoolean()) {
+      c.debug = o.Get("debug").As<Napi::Boolean>().Value();
+    } else {
+      c.debug = o.Get("debug").As<Napi::Number>().Int32Value();
+    }
+  }
+
+  if (o.Has("provider") && o.Get("provider").IsString()) {
+    Napi::String provider = o.Get("provider").As<Napi::String>();
+    std::string s = provider.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    c.provider = p;
+  }
+
+  if (o.Has("modelType") && o.Get("modelType").IsString()) {
+    Napi::String model_type = o.Get("modelType").As<Napi::String>();
+    std::string s = model_type.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    c.model_type = p;
+  }
+
+  return c;
+}
+
+static SherpaOnnxOfflineLMConfig GetOfflineLMConfig(Napi::Object obj) {
+  SherpaOnnxOfflineLMConfig c;
+  memset(&c, 0, sizeof(c));
+
+  if (!obj.Has("lmConfig") || !obj.Get("lmConfig").IsObject()) {
+    return c;
+  }
+
+  Napi::Object o = obj.Get("lmConfig").As<Napi::Object>();
+
+  if (o.Has("model") && o.Get("model").IsString()) {
+    Napi::String model = o.Get("model").As<Napi::String>();
+    std::string s = model.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    c.model = p;
+  }
+
+  if (o.Has("scale") && o.Get("scale").IsNumber()) {
+    c.scale = o.Get("scale").As<Napi::Number>().FloatValue();
+  }
+
+  return c;
+}
+
+static Napi::External<SherpaOnnxOfflineRecognizer>
+CreateOfflineRecognizerWrapper(const Napi::CallbackInfo &info) {
+  Napi::Env env = info.Env();
+  if (info.Length() != 1) {
+    std::ostringstream os;
+    os << "Expect only 1 argument. Given: " << info.Length();
+
+    Napi::TypeError::New(env, os.str()).ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  if (!info[0].IsObject()) {
+    Napi::TypeError::New(env, "Expect an object as the argument")
+        .ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  Napi::Object o = info[0].As<Napi::Object>();
+
+  SherpaOnnxOfflineRecognizerConfig c;
+  memset(&c, 0, sizeof(c));
+  c.feat_config = GetFeatureConfig(o);
+  c.model_config = GetOfflineModelConfig(o);
+  c.lm_config = GetOfflineLMConfig(o);
+
+  if (o.Has("decodingMethod") && o.Get("decodingMethod").IsString()) {
+    Napi::String decoding_method = o.Get("decodingMethod").As<Napi::String>();
+    std::string s = decoding_method.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    c.decoding_method = p;
+  }
+
+  if (o.Has("maxActivePaths") && o.Get("maxActivePaths").IsNumber()) {
+    c.max_active_paths =
+        o.Get("maxActivePaths").As<Napi::Number>().Int32Value();
+  }
+
+  if (o.Has("hotwordsFile") && o.Get("hotwordsFile").IsString()) {
+    Napi::String hotwords_file = o.Get("hotwordsFile").As<Napi::String>();
+    std::string s = hotwords_file.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    c.hotwords_file = p;
+  }
+
+  if (o.Has("hotwordsScore") && o.Get("hotwordsScore").IsNumber()) {
+    c.hotwords_score = o.Get("hotwordsScore").As<Napi::Number>().FloatValue();
+  }
+
+  SherpaOnnxOfflineRecognizer *recognizer = CreateOfflineRecognizer(&c);
+
+  if (c.model_config.transducer.encoder) {
+    delete[] c.model_config.transducer.encoder;
+  }
+
+  if (c.model_config.transducer.decoder) {
+    delete[] c.model_config.transducer.decoder;
+  }
+
+  if (c.model_config.transducer.joiner) {
+    delete[] c.model_config.transducer.joiner;
+  }
+
+  if (c.model_config.paraformer.model) {
+    delete[] c.model_config.paraformer.model;
+  }
+
+  if (c.model_config.nemo_ctc.model) {
+    delete[] c.model_config.nemo_ctc.model;
+  }
+
+  if (c.model_config.whisper.encoder) {
+    delete[] c.model_config.whisper.encoder;
+  }
+
+  if (c.model_config.whisper.decoder) {
+    delete[] c.model_config.whisper.decoder;
+  }
+
+  if (c.model_config.whisper.language) {
+    delete[] c.model_config.whisper.language;
+  }
+
+  if (c.model_config.whisper.task) {
+    delete[] c.model_config.whisper.task;
+  }
+
+  if (c.model_config.tdnn.model) {
+    delete[] c.model_config.tdnn.model;
+  }
+
+  if (c.model_config.tokens) {
+    delete[] c.model_config.tokens;
+  }
+
+  if (c.model_config.provider) {
+    delete[] c.model_config.provider;
+  }
+
+  if (c.model_config.model_type) {
+    delete[] c.model_config.model_type;
+  }
+
+  if (c.lm_config.model) {
+    delete[] c.lm_config.model;
+  }
+
+  if (c.decoding_method) {
+    delete[] c.decoding_method;
+  }
+
+  if (c.hotwords_file) {
+    delete[] c.hotwords_file;
+  }
+
+  if (!recognizer) {
+    Napi::TypeError::New(env, "Please check your config!")
+        .ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  return Napi::External<SherpaOnnxOfflineRecognizer>::New(
+      env, recognizer,
+      [](Napi::Env env, SherpaOnnxOfflineRecognizer *recognizer) {
+        DestroyOfflineRecognizer(recognizer);
+      });
+}
+
+static Napi::External<SherpaOnnxOfflineStream> CreateOfflineStreamWrapper(
+    const Napi::CallbackInfo &info) {
+  Napi::Env env = info.Env();
+  if (info.Length() != 1) {
+    std::ostringstream os;
+    os << "Expect only 1 argument. Given: " << info.Length();
+
+    Napi::TypeError::New(env, os.str()).ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  if (!info[0].IsExternal()) {
+    Napi::TypeError::New(
+        env,
+        "You should pass an offline recognizer pointer as the only argument")
+        .ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  SherpaOnnxOfflineRecognizer *recognizer =
+      info[0].As<Napi::External<SherpaOnnxOfflineRecognizer>>().Data();
+
+  SherpaOnnxOfflineStream *stream = CreateOfflineStream(recognizer);
+
+  return Napi::External<SherpaOnnxOfflineStream>::New(
+      env, stream, [](Napi::Env env, SherpaOnnxOfflineStream *stream) {
+        DestroyOfflineStream(stream);
+      });
+}
+
+static void AcceptWaveformOfflineWrapper(const Napi::CallbackInfo &info) {
+  Napi::Env env = info.Env();
+
+  if (info.Length() != 2) {
+    std::ostringstream os;
+    os << "Expect only 2 arguments. Given: " << info.Length();
+
+    Napi::TypeError::New(env, os.str()).ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  if (!info[0].IsExternal()) {
+    Napi::TypeError::New(env, "Argument 0 should be an online stream pointer.")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  SherpaOnnxOfflineStream *stream =
+      info[0].As<Napi::External<SherpaOnnxOfflineStream>>().Data();
+
+  if (!info[1].IsObject()) {
+    Napi::TypeError::New(env, "Argument 1 should be an object")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  Napi::Object obj = info[1].As<Napi::Object>();
+
+  if (!obj.Has("samples")) {
+    Napi::TypeError::New(env, "The argument object should have a field samples")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  if (!obj.Get("samples").IsTypedArray()) {
+    Napi::TypeError::New(env, "The object['samples'] should be a typed array")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  if (!obj.Has("sampleRate")) {
+    Napi::TypeError::New(env,
+                         "The argument object should have a field sampleRate")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  if (!obj.Get("sampleRate").IsNumber()) {
+    Napi::TypeError::New(env, "The object['samples'] should be a number")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  Napi::Float32Array samples = obj.Get("samples").As<Napi::Float32Array>();
+  int32_t sample_rate = obj.Get("sampleRate").As<Napi::Number>().Int32Value();
+
+  AcceptWaveformOffline(stream, sample_rate, samples.Data(),
+                        samples.ElementLength());
+}
+
+static void DecodeOfflineStreamWrapper(const Napi::CallbackInfo &info) {
+  Napi::Env env = info.Env();
+  if (info.Length() != 2) {
+    std::ostringstream os;
+    os << "Expect only 2 arguments. Given: " << info.Length();
+
+    Napi::TypeError::New(env, os.str()).ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  if (!info[0].IsExternal()) {
+    Napi::TypeError::New(env,
+                         "Argument 0 should be an offline recognizer pointer.")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  if (!info[1].IsExternal()) {
+    Napi::TypeError::New(env, "Argument 1 should be an offline stream pointer.")
+        .ThrowAsJavaScriptException();
+
+    return;
+  }
+
+  SherpaOnnxOfflineRecognizer *recognizer =
+      info[0].As<Napi::External<SherpaOnnxOfflineRecognizer>>().Data();
+
+  SherpaOnnxOfflineStream *stream =
+      info[1].As<Napi::External<SherpaOnnxOfflineStream>>().Data();
+
+  DecodeOfflineStream(recognizer, stream);
+}
+
+static Napi::String GetOfflineStreamResultAsJsonWrapper(
+    const Napi::CallbackInfo &info) {
+  Napi::Env env = info.Env();
+  if (info.Length() != 1) {
+    std::ostringstream os;
+    os << "Expect only 1 argument. Given: " << info.Length();
+
+    Napi::TypeError::New(env, os.str()).ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  if (!info[0].IsExternal()) {
+    Napi::TypeError::New(env, "Argument 0 should be an online stream pointer.")
+        .ThrowAsJavaScriptException();
+
+    return {};
+  }
+
+  SherpaOnnxOfflineStream *stream =
+      info[0].As<Napi::External<SherpaOnnxOfflineStream>>().Data();
+
+  const char *json = GetOfflineStreamResultAsJson(stream);
+  Napi::String s = Napi::String::New(env, json);
+
+  DestroyOfflineStreamResultJson(json);
+
+  return s;
+}
+
+void InitNonStreamingAsr(Napi::Env env, Napi::Object exports) {
+  exports.Set(Napi::String::New(env, "createOfflineRecognizer"),
+              Napi::Function::New(env, CreateOfflineRecognizerWrapper));
+
+  exports.Set(Napi::String::New(env, "createOfflineStream"),
+              Napi::Function::New(env, CreateOfflineStreamWrapper));
+
+  exports.Set(Napi::String::New(env, "acceptWaveformOffline"),
+              Napi::Function::New(env, AcceptWaveformOfflineWrapper));
+
+  exports.Set(Napi::String::New(env, "decodeOfflineStream"),
+              Napi::Function::New(env, DecodeOfflineStreamWrapper));
+
+  exports.Set(Napi::String::New(env, "getOfflineStreamResultAsJson"),
+              Napi::Function::New(env, GetOfflineStreamResultAsJsonWrapper));
+}
--- a/scripts/node-addon-api/src/sherpa-onnx-node-addon-api.cc
查看文件 @697b960
+++ b/scripts/node-addon-api/src/sherpa-onnx-node-addon-api.cc
查看文件 @697b960
@@ -4,15 +4,21 @@
 #include "napi.h"  // NOLINT
 void InitStreamingAsr(Napi::Env env, Napi::Object exports);
+
+void InitNonStreamingAsr(Napi::Env env, Napi::Object exports);
+
+void InitVad(Napi::Env env, Napi::Object exports);
+
 void InitWaveReader(Napi::Env env, Napi::Object exports);
+
 void InitWaveWriter(Napi::Env env, Napi::Object exports);
-void InitVad(Napi::Env env, Napi::Object exports);
 Napi::Object Init(Napi::Env env, Napi::Object exports) {
   InitStreamingAsr(env, exports);
+  InitNonStreamingAsr(env, exports);
+  InitVad(env, exports);
   InitWaveReader(env, exports);
   InitWaveWriter(env, exports);
-  InitVad(env, exports);
   return exports;
 }
--- a/scripts/node-addon-api/src/streaming-asr.cc
查看文件 @697b960
+++ b/scripts/node-addon-api/src/streaming-asr.cc
查看文件 @697b960
@@ -13,7 +13,7 @@
   }
 };
  */
-static SherpaOnnxFeatureConfig GetFeatureConfig(Napi::Object obj) {
+SherpaOnnxFeatureConfig GetFeatureConfig(Napi::Object obj) {
   SherpaOnnxFeatureConfig config;
   memset(&config, 0, sizeof(config));
@@ -113,6 +113,39 @@ GetOnlineZipformer2CtcModelConfig(Napi::Object obj) {
   return config;
 }
+static SherpaOnnxOnlineParaformerModelConfig GetOnlineParaformerModelConfig(
+    Napi::Object obj) {
+  SherpaOnnxOnlineParaformerModelConfig config;
+  memset(&config, 0, sizeof(config));
+
+  if (!obj.Has("paraformer") || !obj.Get("paraformer").IsObject()) {
+    return config;
+  }
+
+  Napi::Object o = obj.Get("paraformer").As<Napi::Object>();
+
+  if (o.Has("encoder") && o.Get("encoder").IsString()) {
+    Napi::String encoder = o.Get("encoder").As<Napi::String>();
+    std::string s = encoder.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.encoder = p;
+  }
+
+  if (o.Has("decoder") && o.Get("decoder").IsString()) {
+    Napi::String decoder = o.Get("decoder").As<Napi::String>();
+    std::string s = decoder.Utf8Value();
+    char *p = new char[s.size() + 1];
+    std::copy(s.begin(), s.end(), p);
+    p[s.size()] = 0;
+
+    config.decoder = p;
+  }
+  return config;
+}
+
 static SherpaOnnxOnlineModelConfig GetOnlineModelConfig(Napi::Object obj) {
   SherpaOnnxOnlineModelConfig config;
   memset(&config, 0, sizeof(config));
@@ -124,6 +157,7 @@ static SherpaOnnxOnlineModelConfig GetOnlineModelConfig(Napi::Object obj) {
   Napi::Object o = obj.Get("modelConfig").As<Napi::Object>();
   config.transducer = GetOnlineTransducerModelConfig(o);
+  config.paraformer = GetOnlineParaformerModelConfig(o);
   config.zipformer2_ctc = GetOnlineZipformer2CtcModelConfig(o);
   if (o.Has("tokens") && o.Get("tokens").IsString()) {
@@ -290,35 +324,6 @@ static Napi::External<SherpaOnnxOnlineRecognizer> CreateOnlineRecognizerWrapper(
   c.ctc_fst_decoder_config = GetCtcFstDecoderConfig(config);
-#if 0
-  printf("encoder: %s\n", c.model_config.transducer.encoder
-                              ? c.model_config.transducer.encoder
-                              : "no");
-  printf("decoder: %s\n", c.model_config.transducer.decoder
-                              ? c.model_config.transducer.decoder
-                              : "no");
-  printf("joiner: %s\n", c.model_config.transducer.joiner
-                             ? c.model_config.transducer.joiner
-                             : "no");
-
-  printf("tokens: %s\n", c.model_config.tokens ? c.model_config.tokens : "no");
-  printf("num_threads: %d\n", c.model_config.num_threads);
-  printf("provider: %s\n",
-         c.model_config.provider ? c.model_config.provider : "no");
-  printf("debug: %d\n", c.model_config.debug);
-  printf("model_type: %s\n",
-         c.model_config.model_type ? c.model_config.model_type : "no");
-
-  printf("decoding_method: %s\n", c.decoding_method ? c.decoding_method : "no");
-  printf("max_active_paths: %d\n", c.max_active_paths);
-  printf("enable_endpoint: %d\n", c.enable_endpoint);
-  printf("rule1_min_trailing_silence: %.3f\n", c.rule1_min_trailing_silence);
-  printf("rule2_min_trailing_silence: %.3f\n", c.rule2_min_trailing_silence);
-  printf("rule3_min_utterance_length: %.3f\n", c.rule3_min_utterance_length);
-  printf("hotwords_file: %s\n", c.hotwords_file ? c.hotwords_file : "no");
-  printf("hotwords_score: %.3f\n", c.hotwords_score);
-#endif
-
   SherpaOnnxOnlineRecognizer *recognizer = CreateOnlineRecognizer(&c);
   if (c.model_config.transducer.encoder) {
@@ -333,6 +338,14 @@ static Napi::External<SherpaOnnxOnlineRecognizer> CreateOnlineRecognizerWrapper(
     delete[] c.model_config.transducer.joiner;
   }
+  if (c.model_config.paraformer.encoder) {
+    delete[] c.model_config.paraformer.encoder;
+  }
+
+  if (c.model_config.paraformer.decoder) {
+    delete[] c.model_config.paraformer.decoder;
+  }
+
   if (c.model_config.zipformer2_ctc.model) {
     delete[] c.model_config.zipformer2_ctc.model;
   }
@@ -389,7 +402,8 @@ static Napi::External<SherpaOnnxOnlineStream> CreateOnlineStreamWrapper(
   if (!info[0].IsExternal()) {
     Napi::TypeError::New(
-        env, "You should pass a recognizer pointer as the only argument")
+        env,
+        "You should pass an online recognizer pointer as the only argument")
         .ThrowAsJavaScriptException();
     return {};