Add HarmonyOS demo for Kokoro TTS 1.0 (#1813)

Fangjun Kuang · GitHub
Commit 5ca246559bb896d0c6f977d1c0a19bc4b05876e2 5ca24655 1 parent 239b43c2
harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/ets/components/NonStreamingTts.ets
harmony-os/SherpaOnnxTts/entry/src/main/ets/workers/NonStreamingTtsWorker.ets
--- a/harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/ets/components/NonStreamingTts.ets
查看文件 @5ca2465
+++ b/harmony-os/SherpaOnnxHar/sherpa_onnx/src/main/ets/components/NonStreamingTts.ets
查看文件 @5ca2465
@@ -34,6 +34,8 @@ export class OfflineTtsKokoroModelConfig {
   public tokens: string = '';
   public dataDir: string = '';
   public lengthScale: number = 1.0;
+   public dictDir: string = '';
+   public lexicon: string = '';
 }
 
 export class OfflineTtsModelConfig {
--- a/harmony-os/SherpaOnnxTts/entry/src/main/ets/workers/NonStreamingTtsWorker.ets
查看文件 @5ca2465
+++ b/harmony-os/SherpaOnnxTts/entry/src/main/ets/workers/NonStreamingTtsWorker.ets
查看文件 @5ca2465
@@ -179,6 +179,16 @@ function initTts(context: Context): OfflineTts {
   // voices = 'voices.bin'
   // dataDir = 'espeak-ng-data';
 
+   // Example 11
+   // https://k2-fsa.github.io/sherpa/onnx/tts/pretrained_models/kokoro.html
+   // modelDir = 'kokoro-multi-lang-v1_0';
+   // modelName = 'model.onnx';
+   // voices = 'voices.bin'
+   // dataDir = 'espeak-ng-data';
+   // dictDir = 'dict';
+   // lexicon = 'lexicon-us-en.txt,lexicon-zh.txt';
+   // ruleFsts = `date-zh.fst,phone-zh.fst,number-zh.fst`;
+ 
   // ============================================================
   // Please don't change the remaining part of this function
   // ============================================================
@@ -225,7 +235,14 @@ function initTts(context: Context): OfflineTts {
     ruleFars = tmp.join(',');
   }
 
-   if (lexicon != '') {
+   if (lexicon.includes(",")) {
+     let v = lexicon.split(',')
+     let tmp: string[] = [];
+     for (const f of v) {
+       tmp.push(modelDir + '/' + f);
+     }
+     lexicon = tmp.join(',');
+   } else if (lexicon != '') {
     lexicon = modelDir + '/' + lexicon;
   }
 
@@ -250,6 +267,7 @@ function initTts(context: Context): OfflineTts {
     config.model.vits.model = modelName;
   }
 
+   if (voices == '') {
     config.model.vits.lexicon = lexicon;
     config.model.vits.tokens = tokens;
     config.model.vits.dataDir = dataDir;
@@ -261,15 +279,21 @@ function initTts(context: Context): OfflineTts {
     config.model.matcha.tokens = tokens;
     config.model.matcha.dataDir = dataDir;
     config.model.matcha.dictDir = dictDir;
+   }
 
   if (voices != '') {
     config.model.kokoro.model = modelName;
   } else {
     config.model.kokoro.model = '';
   }
+ 
+   if (voices != '') {
     config.model.kokoro.voices = voices;
     config.model.kokoro.tokens = tokens;
     config.model.kokoro.dataDir = dataDir;
+     config.model.kokoro.dictDir = dictDir;
+     config.model.kokoro.lexicon = lexicon;
+   }
 
   config.model.numThreads = 2;
   config.model.debug = true;