From 8590ceaee7fcf6984da3312014e0b2923f3dc5bb Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Mateusz=20S=C5=82uszniak?= <mateusz.sluszniak@swmansion.com>
Date: Thu, 12 Feb 2026 12:30:48 +0100
Subject: [PATCH 1/2] bug-fix: protect acquiring buffer by different workers

---
 apps/speech/package.json                      |  2 +-
 .../stream/OnlineASRProcessor.cpp             | 29 +++++++++++++------
 .../stream/OnlineASRProcessor.h               |  3 ++
 yarn.lock                                     | 10 +++----
 4 files changed, 29 insertions(+), 15 deletions(-)
diff --git a/apps/speech/package.json b/apps/speech/package.json
index 1c0607be2..b222acad9 100644
--- a/apps/speech/package.json
+++ b/apps/speech/package.json
@@ -19,7 +19,7 @@
     "metro-config": "^0.81.0",
     "react": "19.1.0",
     "react-native": "0.81.5",
-    "react-native-audio-api": "0.11.3",
+    "react-native-audio-api": "0.11.1",
     "react-native-device-info": "^14.0.4",
     "react-native-executorch": "workspace:*",
     "react-native-reanimated": "~4.1.1",
diff --git a/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.cpp b/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.cpp
index 3137d274b..dffcca848 100644
--- a/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.cpp
+++ b/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.cpp
@@ -10,11 +10,19 @@ using namespace types;
 OnlineASRProcessor::OnlineASRProcessor(const ASR *asr) : asr(asr) {}
 
 void OnlineASRProcessor::insertAudioChunk(std::span<const float> audio) {
+  std::scoped_lock<std::mutex> lock(audioMutex);
   audioBuffer.insert(audioBuffer.end(), audio.begin(), audio.end());
 }
 
 ProcessResult OnlineASRProcessor::processIter(const DecodingOptions &options) {
-  std::vector<Segment> res = asr->transcribe(audioBuffer, options);
+  std::vector<float> snapshot;
+
+  {
+    std::scoped_lock<std::mutex> lock(audioMutex);
+    snapshot = audioBuffer;
+  }
+
+  std::vector<Segment> res = asr->transcribe(snapshot, options);
 
   std::vector<Word> tsw;
   for (const auto &segment : res) {
@@ -28,20 +36,19 @@ ProcessResult OnlineASRProcessor::processIter(const DecodingOptions &options) {
   this->committed.insert(this->committed.end(), flushed.begin(), flushed.end());
 
   constexpr int32_t chunkThresholdSec = 15;
-  if (static_cast<float>(audioBuffer.size()) /
-          OnlineASRProcessor::kSamplingRate >
+  if (static_cast<float>(snapshot.size()) / OnlineASRProcessor::kSamplingRate >
       chunkThresholdSec) {
     chunkCompletedSegment(res);
   }
 
-  auto move_to_vector = [](auto& container) {
-      return std::vector<Word>(std::make_move_iterator(container.begin()),
-                              std::make_move_iterator(container.end()));
+  auto move_to_vector = [](auto &container) {
+    return std::vector<Word>(std::make_move_iterator(container.begin()),
+                             std::make_move_iterator(container.end()));
   };
 
   std::deque<Word> nonCommittedWords = this->hypothesisBuffer.complete();
 
-  return { move_to_vector(flushed), move_to_vector(nonCommittedWords) };
+  return {move_to_vector(flushed), move_to_vector(nonCommittedWords)};
 }
 
 void OnlineASRProcessor::chunkCompletedSegment(std::span<const Segment> res) {
@@ -74,6 +81,7 @@ void OnlineASRProcessor::chunkAt(float time) {
   auto startIndex =
       static_cast<size_t>(cutSeconds * OnlineASRProcessor::kSamplingRate);
 
+  std::scoped_lock<std::mutex> lock(audioMutex);
   if (startIndex < audioBuffer.size()) {
     audioBuffer.erase(audioBuffer.begin(), audioBuffer.begin() + startIndex);
   } else {
@@ -88,8 +96,11 @@ std::vector<Word> OnlineASRProcessor::finish() {
   std::vector<Word> buffer(std::make_move_iterator(bufferDeq.begin()),
                            std::make_move_iterator(bufferDeq.end()));
 
-  this->bufferTimeOffset += static_cast<float>(audioBuffer.size()) /
-                            OnlineASRProcessor::kSamplingRate;
+  {
+    std::scoped_lock<std::mutex> lock(audioMutex);
+    this->bufferTimeOffset += static_cast<float>(audioBuffer.size()) /
+                              OnlineASRProcessor::kSamplingRate;
+  }
   return buffer;
 }
 
diff --git a/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.h b/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.h
index 98944bdbe..2fa0bdd8b 100644
--- a/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.h
+++ b/packages/react-native-executorch/common/rnexecutorch/models/speech_to_text/stream/OnlineASRProcessor.h
@@ -5,6 +5,8 @@
 #include "rnexecutorch/models/speech_to_text/types/ProcessResult.h"
 #include "rnexecutorch/models/speech_to_text/types/Word.h"
 
+#include <mutex>
+
 namespace rnexecutorch::models::speech_to_text::stream {
 
 class OnlineASRProcessor {
@@ -16,6 +18,7 @@ class OnlineASRProcessor {
   std::vector<types::Word> finish();
 
   std::vector<float> audioBuffer;
+  mutable std::mutex audioMutex;
 
 private:
   const asr::ASR *asr;
diff --git a/yarn.lock b/yarn.lock
index ccc0d534e..4e2b99434 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -12847,9 +12847,9 @@ __metadata:
   languageName: node
   linkType: hard
 
-"react-native-audio-api@npm:0.11.3":
-  version: 0.11.3
-  resolution: "react-native-audio-api@npm:0.11.3"
+"react-native-audio-api@npm:0.11.1":
+  version: 0.11.1
+  resolution: "react-native-audio-api@npm:0.11.1"
   dependencies:
     semver: "npm:^7.7.3"
   peerDependencies:
@@ -12857,7 +12857,7 @@ __metadata:
     react-native: "*"
   bin:
     setup-rn-audio-api-web: scripts/setup-rn-audio-api-web.js
-  checksum: 10/0c973061a81196f93cb19eecf3c6126deaaaa28ad89c7830cdcfc833faad594fb275b733d12729aa11676e0d571c493006fdef4bf243a79dcb142666e87bcf0b
+  checksum: 10/3e062c479ec76015fe068af3b03928b591c11fc6873b030b7756ab6e6eb2a17499801d061002997121fbfb746040d7039266d81196c3ae05ee8b489b07a97047
   languageName: node
   linkType: hard
 
@@ -14100,7 +14100,7 @@ __metadata:
     metro-config: "npm:^0.81.0"
     react: "npm:19.1.0"
     react-native: "npm:0.81.5"
-    react-native-audio-api: "npm:0.11.3"
+    react-native-audio-api: "npm:0.11.1"
     react-native-device-info: "npm:^14.0.4"
     react-native-executorch: "workspace:*"
     react-native-reanimated: "npm:~4.1.1"

From cc8c1c88a7c74b1db1c466a9dad99601278a4f92 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Mateusz=20S=C5=82uszniak?= <mateusz.sluszniak@swmansion.com>
Date: Thu, 12 Feb 2026 12:44:20 +0100
Subject: [PATCH 2/2] chore: revert changing rnaa version

---
 apps/speech/package.json |  2 +-
 yarn.lock                | 10 +++++-----
 2 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/apps/speech/package.json b/apps/speech/package.json
index b222acad9..1c0607be2 100644
--- a/apps/speech/package.json
+++ b/apps/speech/package.json
@@ -19,7 +19,7 @@
     "metro-config": "^0.81.0",
     "react": "19.1.0",
     "react-native": "0.81.5",
-    "react-native-audio-api": "0.11.1",
+    "react-native-audio-api": "0.11.3",
     "react-native-device-info": "^14.0.4",
     "react-native-executorch": "workspace:*",
     "react-native-reanimated": "~4.1.1",
diff --git a/yarn.lock b/yarn.lock
index 4e2b99434..ccc0d534e 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -12847,9 +12847,9 @@ __metadata:
   languageName: node
   linkType: hard
 
-"react-native-audio-api@npm:0.11.1":
-  version: 0.11.1
-  resolution: "react-native-audio-api@npm:0.11.1"
+"react-native-audio-api@npm:0.11.3":
+  version: 0.11.3
+  resolution: "react-native-audio-api@npm:0.11.3"
   dependencies:
     semver: "npm:^7.7.3"
   peerDependencies:
@@ -12857,7 +12857,7 @@ __metadata:
     react-native: "*"
   bin:
     setup-rn-audio-api-web: scripts/setup-rn-audio-api-web.js
-  checksum: 10/3e062c479ec76015fe068af3b03928b591c11fc6873b030b7756ab6e6eb2a17499801d061002997121fbfb746040d7039266d81196c3ae05ee8b489b07a97047
+  checksum: 10/0c973061a81196f93cb19eecf3c6126deaaaa28ad89c7830cdcfc833faad594fb275b733d12729aa11676e0d571c493006fdef4bf243a79dcb142666e87bcf0b
   languageName: node
   linkType: hard
 
@@ -14100,7 +14100,7 @@ __metadata:
     metro-config: "npm:^0.81.0"
     react: "npm:19.1.0"
     react-native: "npm:0.81.5"
-    react-native-audio-api: "npm:0.11.1"
+    react-native-audio-api: "npm:0.11.3"
     react-native-device-info: "npm:^14.0.4"
     react-native-executorch: "workspace:*"
     react-native-reanimated: "npm:~4.1.1"