StaticfunctionalityFügt eine Mikrofonschaltfläche zu einem HTMLInputElement vom Typ „Text“ oder einem HTMLTextareaElement für hinzu Sprach-zu-Text-Eingabe über ein selbst gehostetes Whisper-Modell auf dem Formcycle-Server.
Im Gegensatz zur Web Speech API-Variante (MEDIA.INPUT.SPEECH) verarbeitet diese Funktionalität alle Audiodaten lokal auf dem Formcycle-Server (oder einem beliebigen lokalen Server über die OpenAI /v1/audio/transcriptions API (*überprüfen Sie die Whisper.kt-Klassendokumentation für weitere Informationen)) unter Verwendung eines selbstgehosteten Whisper-Modells über whisper.cpp.
Keine Audiodaten verlassen den Server. Es besteht keine Abhängigkeit von Google, Microsoft, OpenAI oder einem anderen Cloud-Anbieter. Dadurch ist es vollständig DSGVO-konform, ohne dass eine zusätzliche Einwilligung zur cloudbasierten Sprachverarbeitung erforderlich ist.
| Funktion | MEDIA.INPUT.SPEECH |
MEDIA.INPUT.SPEECH.WHISPER |
|---|---|---|
| Verarbeitung | Browser-Cloud-API (Echtzeit) | Lokaler Server (Batch) |
| Daten verlassen das Gerät? | Ja (Wolke) | Nein (nur localhost) |
| DSGVO-Einwilligung erforderlich? | Ja (Art. 13) | Nein |
| Echtzeit-Interim? | Ja | Ja |
| Browserunterstützung | Chrome, Edge (begrenzt) | Alle modernen Browser |
Provided by the CodBi.
Provided by the CodBi. Must be an input type="text" or textarea.
Stellt den Media_Input_Speech_Whisper.functionality bereit.
Remarks
Ursprünglicher Autor: Callari, Salvatore (Callari@WaXCode.net) Betreuer: Callari, Salvatore (Callari@WaXCode.net)