Minor fixes for rknn (#1925)

Fangjun Kuang · GitHub
Commit 82cb8a5dc3c4200f45265f0b1a0b75f593a39285 82cb8a5d 1 parent 2f9a2b20
sherpa-onnx/csrc/offline-whisper-greedy-search-decoder.cc
sherpa-onnx/csrc/online-model-config.cc
sherpa-onnx/csrc/rknn/online-zipformer-transducer-model-rknn.cc
sherpa-onnx/csrc/sherpa-onnx-alsa.cc
sherpa-onnx/csrc/sherpa-onnx.cc
sherpa-onnx/csrc/text-utils.cc
sherpa-onnx/csrc/text-utils.h
--- a/sherpa-onnx/csrc/offline-whisper-greedy-search-decoder.cc
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/offline-whisper-greedy-search-decoder.cc
查看文件 @82cb8a5
@@ -99,7 +99,7 @@ OfflineWhisperGreedySearchDecoder::Decode(Ort::Value cross_k,
   int32_t n_text_ctx = model_->TextCtx();
 
   std::vector<int32_t> predicted_tokens;
-   for (int32_t i = 0; i < n_text_ctx; ++i) {
+   for (int32_t i = 0; i < n_text_ctx / 2; ++i) {
     if (max_token_id == model_->EOT()) {
       break;
     }
--- a/sherpa-onnx/csrc/online-model-config.cc
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/online-model-config.cc
查看文件 @82cb8a5
@@ -7,6 +7,7 @@
 
 #include "sherpa-onnx/csrc/file-utils.h"
 #include "sherpa-onnx/csrc/macros.h"
+ #include "sherpa-onnx/csrc/text-utils.h"
 
 namespace sherpa_onnx {
 
@@ -65,6 +66,29 @@ bool OnlineModelConfig::Validate() const {
       SHERPA_ONNX_LOGE("num_threads should be > 0. Given %d", num_threads);
       return false;
     }
+     if (!transducer.encoder.empty() && (EndsWith(transducer.encoder, ".rknn") ||
+                                         EndsWith(transducer.decoder, ".rknn") ||
+                                         EndsWith(transducer.joiner, ".rknn"))) {
+       SHERPA_ONNX_LOGE(
+           "--provider is %s, which is not rknn, but you pass rknn model "
+           "filenames. encoder: '%s', decoder: '%s', joiner: '%s'",
+           provider_config.provider.c_str(), transducer.encoder.c_str(),
+           transducer.decoder.c_str(), transducer.joiner.c_str());
+       return false;
+     }
+   }
+ 
+   if (provider_config.provider == "rknn") {
+     if (!transducer.encoder.empty() && (EndsWith(transducer.encoder, ".onnx") ||
+                                         EndsWith(transducer.decoder, ".onnx") ||
+                                         EndsWith(transducer.joiner, ".onnx"))) {
+       SHERPA_ONNX_LOGE(
+           "--provider is rknn, but you pass onnx model "
+           "filenames. encoder: '%s', decoder: '%s', joiner: %'s'",
+           transducer.encoder.c_str(), transducer.decoder.c_str(),
+           transducer.joiner.c_str());
+       return false;
+     }
   }
 
   if (!tokens_buf.empty() && FileExists(tokens)) {
--- a/sherpa-onnx/csrc/rknn/online-zipformer-transducer-model-rknn.cc
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/rknn/online-zipformer-transducer-model-rknn.cc
查看文件 @82cb8a5
@@ -463,8 +463,10 @@ class OnlineZipformerTransducerModelRknn::Impl {
     }
     auto meta = Parse(custom_string);
 
-     for (const auto &p : meta) {
-       SHERPA_ONNX_LOGE("%s: %s", p.first.c_str(), p.second.c_str());
+     if (config_.debug) {
+       for (const auto &p : meta) {
+         SHERPA_ONNX_LOGE("%s: %s", p.first.c_str(), p.second.c_str());
+       }
     }
 
     if (meta.count("encoder_dims")) {
--- a/sherpa-onnx/csrc/sherpa-onnx-alsa.cc
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/sherpa-onnx-alsa.cc
查看文件 @82cb8a5
@@ -90,6 +90,8 @@ as the device_name.
     exit(-1);
   }
 
+   fprintf(stderr, "Started! Please speak\n");
+ 
   int32_t chunk = 0.1 * alsa.GetActualSampleRate();
 
   std::string last_text;
--- a/sherpa-onnx/csrc/sherpa-onnx.cc
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/sherpa-onnx.cc
查看文件 @82cb8a5
@@ -158,8 +158,11 @@ for a list of pre-trained models to download.
     const float rtf = s.elapsed_seconds / s.duration;
 
     os << po.GetArg(i) << "\n";
-     os << std::setprecision(2) << "Elapsed seconds: " << s.elapsed_seconds
-        << ", Real time factor (RTF): " << rtf << "\n";
+     os << "Number of threads: " << config.model_config.num_threads << ", "
+        << std::setprecision(2) << "Elapsed seconds: " << s.elapsed_seconds
+        << ", Audio duration (s): " << s.duration
+        << ", Real time factor (RTF) = " << s.elapsed_seconds << "/"
+        << s.duration << " = " << rtf << "\n";
     const auto r = recognizer.GetResult(s.online_stream.get());
     os << r.text << "\n";
     os << r.AsJsonString() << "\n\n";
--- a/sherpa-onnx/csrc/text-utils.cc
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/text-utils.cc
查看文件 @82cb8a5
@@ -699,4 +699,12 @@ std::string ToString(const std::wstring &s) {
   return converter.to_bytes(s);
 }
 
+ bool EndsWith(const std::string &haystack, const std::string &needle) {
+   if (needle.size() > haystack.size()) {
+     return false;
+   }
+ 
+   return std::equal(needle.rbegin(), needle.rend(), haystack.rbegin());
+ }
+ 
 }  // namespace sherpa_onnx
--- a/sherpa-onnx/csrc/text-utils.h
查看文件 @82cb8a5
+++ b/sherpa-onnx/csrc/text-utils.h
查看文件 @82cb8a5
@@ -145,6 +145,8 @@ std::wstring ToWideString(const std::string &s);
 
 std::string ToString(const std::wstring &s);
 
+ bool EndsWith(const std::string &haystack, const std::string &needle);
+ 
 }  // namespace sherpa_onnx
 
 #endif  // SHERPA_ONNX_CSRC_TEXT_UTILS_H_