Otosaku
diff --git a/‎.gitignore‎
Lines changed: 25 additions & 0 deletions b/‎.gitignore‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎README.md‎
Lines changed: 111 additions & 0 deletions b/‎README.md‎
Lines changed: 111 additions & 0 deletions
diff --git a/‎build.gradle.kts‎
Lines changed: 4 additions & 0 deletions b/‎build.gradle.kts‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎gradle.properties‎
Lines changed: 4 additions & 0 deletions b/‎gradle.properties‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎gradle/wrapper/gradle-wrapper.properties‎
Lines changed: 7 additions & 0 deletions b/‎gradle/wrapper/gradle-wrapper.properties‎
Lines changed: 7 additions & 0 deletions
@@ -0,0 +1,25 @@
+# Gradle
+.gradle/
+build/
+!gradle/wrapper/gradle-wrapper.jar
+
+# Android Studio
+.idea/
+*.iml
+local.properties
+
+# Kotlin
+*.class
+*.jar
+*.war
+*.nar
+*.ear
+*.zip
+*.tar.gz
+*.rar
+
+# macOS
+.DS_Store
+
+# Logs
+*.log
@@ -0,0 +1,111 @@
+# NeMoFeatureExtractor-Android
+
+Kotlin library for extracting mel spectrograms compatible with NVIDIA NeMo models on Android.
+
+## Features
+
+- NeMo-compatible mel spectrogram extraction
+- Support for VAD (MarbleNet), ASR (Conformer, Parakeet), and Speaker (TitaNet) models
+- Pre-computed NeMo filterbank for maximum accuracy
+- Pure Kotlin implementation with no external dependencies
+- Configurable normalization modes
+
+## Requirements
+
+- Android API 24+
+- Kotlin 1.9+
+
+## Installation
+
+### Gradle
+
+Add JitPack repository to your project's `settings.gradle.kts`:
+
+```kotlin
+dependencyResolutionManagement {
+    repositories {
+        maven { url = uri("https://jitpack.io") }
+    }
+}
+```
+
+Add the dependency to your module's `build.gradle.kts`:
+
+```kotlin
+dependencies {
+    implementation("com.github.Otosaku:NeMoFeatureExtractor-Android:1.0.0")
+}
+```
+
+## Usage
+
+### Basic Usage
+
+```kotlin
+import com.otosaku.nemofeatureextractor.NeMoFeatureExtractor
+import com.otosaku.nemofeatureextractor.MelSpectrogramConfig
+
+// For VAD (MarbleNet)
+val vadExtractor = NeMoFeatureExtractor(context, MelSpectrogramConfig.nemoVAD)
+val features = vadExtractor.process(audioSamples)
+
+// For ASR (Conformer, Parakeet)
+val asrExtractor = NeMoFeatureExtractor(context, MelSpectrogramConfig.nemoASR)
+val features = asrExtractor.process(audioSamples)
+
+// For Speaker (TitaNet)
+val speakerExtractor = NeMoFeatureExtractor(context, MelSpectrogramConfig.nemoSpeaker)
+val features = speakerExtractor.process(audioSamples)
+```
+
+### Without Context (generates filterbank)
+
+```kotlin
+val extractor = NeMoFeatureExtractor(MelSpectrogramConfig.nemoVAD)
+val features = extractor.process(audioSamples)
+```
+
+### Custom Configuration
+
+```kotlin
+val config = MelSpectrogramConfig(
+    sampleRate = 16000,
+    nMels = 80,
+    nFFT = 512,
+    windowSize = 400,
+    hopLength = 160,
+    normalization = NormalizationMode.PER_FEATURE,
+    preemph = 0.97f
+)
+
+val extractor = NeMoFeatureExtractor(context, config)
+```
+
+## Audio Requirements
+
+- Sample rate: 16,000 Hz
+- Channels: Mono
+- Format: Float32 array
+
+## Configuration Presets
+
+| Preset | Normalization | Pad To | Use Case |
+|--------|---------------|--------|----------|
+| `nemoVAD` | None | 2 | Voice Activity Detection (MarbleNet) |
+| `nemoASR` | Per-feature | 0 | Speech Recognition (Conformer, Parakeet) |
+| `nemoSpeaker` | Per-feature | 16 | Speaker Verification (TitaNet) |
+
+## Output Format
+
+The `process()` method returns `Array<FloatArray>` with shape `[nMels, nFrames]`:
+- `nMels`: Number of mel frequency bins (default: 80)
+- `nFrames`: Number of time frames (depends on audio length)
+
+## License
+
+MIT License
+
+## Related Projects
+
+- [NeMoFeatureExtractor-iOS](https://github.com/Otosaku/NeMoFeatureExtractor-iOS) - iOS/macOS version
+- [NVIDIA NeMo](https://github.com/NVIDIA/NeMo) - Original implementation
@@ -0,0 +1,4 @@
+plugins {
+    id("com.android.library") version "8.2.0" apply false
+    id("org.jetbrains.kotlin.android") version "1.9.22" apply false
+}
@@ -0,0 +1,4 @@
+org.gradle.jvmargs=-Xmx2048m -Dfile.encoding=UTF-8
+android.useAndroidX=true
+kotlin.code.style=official
+android.nonTransitiveRClass=true
@@ -0,0 +1,7 @@
+distributionBase=GRADLE_USER_HOME
+distributionPath=wrapper/dists
+distributionUrl=https\://services.gradle.org/distributions/gradle-8.4-bin.zip
+networkTimeout=10000
+validateDistributionUrl=true
+zipStoreBase=GRADLE_USER_HOME
+zipStorePath=wrapper/dists