software-mansion · IgorSwat · Mar 25, 2026 · Mar 25, 2026
diff --git a/docs/docs/02-benchmarks/inference-time.md b/docs/docs/02-benchmarks/inference-time.md
@@ -139,15 +139,15 @@ Average time for encoding audio of given length over 10 runs. For `Whisper` mode
 
 | Model              | iPhone 17 Pro (XNNPACK) [ms] | iPhone 16 Pro (XNNPACK) [ms] | iPhone SE 3 (XNNPACK) [ms] | Samsung Galaxy S24 (XNNPACK) [ms] | OnePlus 12 (XNNPACK) [ms] |
 | ------------------ | :--------------------------: | :--------------------------: | :------------------------: | :-------------------------------: | :-----------------------: |
-| Whisper-tiny (30s) |             248              |             254              |            1145            |                435                |            526            |
+| Whisper-tiny (30s) |              89              |              93              |            403             |                277                |            260            |
 
 ### Decoding
 
 Average time for decoding one token in sequence of approximately 100 tokens, with encoding context is obtained from audio of noted length.
 
 | Model              | iPhone 17 Pro (XNNPACK) [ms] | iPhone 16 Pro (XNNPACK) [ms] | iPhone SE 3 (XNNPACK) [ms] | Samsung Galaxy S24 (XNNPACK) [ms] | OnePlus 12 (XNNPACK) [ms] |
 | ------------------ | :--------------------------: | :--------------------------: | :------------------------: | :-------------------------------: | :-----------------------: |
-| Whisper-tiny (30s) |              23              |              25              |            121             |                92                 |            115            |
+| Whisper-tiny (30s) |              6               |              6               |             40             |                28                 |            25             |
 
 ## Text to Speech
 

diff --git a/docs/versioned_docs/version-0.8.x/02-benchmarks/inference-time.md b/docs/versioned_docs/version-0.8.x/02-benchmarks/inference-time.md
@@ -139,15 +139,15 @@ Average time for encoding audio of given length over 10 runs. For `Whisper` mode
 
 | Model              | iPhone 17 Pro (XNNPACK) [ms] | iPhone 16 Pro (XNNPACK) [ms] | iPhone SE 3 (XNNPACK) [ms] | Samsung Galaxy S24 (XNNPACK) [ms] | OnePlus 12 (XNNPACK) [ms] |
 | ------------------ | :--------------------------: | :--------------------------: | :------------------------: | :-------------------------------: | :-----------------------: |
-| Whisper-tiny (30s) |             248              |             254              |            1145            |                435                |            526            |
+| Whisper-tiny (30s) |              89              |              93              |            403             |                277                |            260            |
 
 ### Decoding
 
 Average time for decoding one token in sequence of approximately 100 tokens, with encoding context is obtained from audio of noted length.
 
 | Model              | iPhone 17 Pro (XNNPACK) [ms] | iPhone 16 Pro (XNNPACK) [ms] | iPhone SE 3 (XNNPACK) [ms] | Samsung Galaxy S24 (XNNPACK) [ms] | OnePlus 12 (XNNPACK) [ms] |
 | ------------------ | :--------------------------: | :--------------------------: | :------------------------: | :-------------------------------: | :-----------------------: |
-| Whisper-tiny (30s) |              23              |              25              |            121             |                92                 |            115            |
+| Whisper-tiny (30s) |              6               |              6               |             40             |                28                 |            25             |
 
 ## Text to Speech