VoiceFlow Desk
v1.1.0Lokale Sprache-zu-Text Desktop-App
Professionelle Spracherkennung direkt auf Ihrem Rechner – ohne Cloud, ohne Abo, ohne Datenweitergabe. Diktieren Sie in jede Anwendung, mit automatischer KI-Textoptimierung und DSGVO-konformer Pseudonymisierung.
Die App in Aktion
Professionelle Oberfläche mit Dark Mode, übersichtlichen Bedienelementen und konfigurierbaren Einstellungen.
Hauptfenster mit Profil-Auswahl, Mikrofon-Konfiguration und Echtzeit-Transkription
Hotkey, Streaming & Auto-Insert
Übersetzung & Profile
Sprechererkennung (Diarization)
Funktionen im Überblick
Alles was Sie für professionelle Diktat-Workflows brauchen – in einer einzigen Desktop-App.
Echtzeit-Transkription (VAD)
Sprache wird während der Aufnahme live in Text umgewandelt. Silero VAD erkennt Sprechpausen und transkribiert Segment für Segment – Text erscheint progressiv.
KI-Textoptimierung
Mehrere LLM-Provider (Ollama lokal, OpenAI, Anthropic) optimieren Ihren Text: Grammatik, Stil und Formatierung – je nach gewähltem Profil.
DSGVO-Pseudonymisierung
Vor jedem Cloud-LLM-Call werden Namen, E-Mails, IBAN und Telefonnummern automatisch durch Platzhalter ersetzt. In der Antwort wird de-pseudonymisiert. Klartext verlässt nie Ihren Rechner.
Audio-Auto-Löschung
WAV-Dateien werden nach erfolgreicher Transkription automatisch gelöscht (Art. 5 Abs. 1e DSGVO – Speicherbegrenzung). Keine unnötige Vorhaltung sensibler Audiodaten.
Clipboard-Auto-Clear
Die Zwischenablage wird nach konfigurierbarem Timeout (Standard: 60s) automatisch bereinigt. Kein versehentliches Einfügen sensibler Transkriptionen in falsche Fenster.
Consent-Banner & Transparenz
Beim ersten Start informiert ein Einwilligungsdialog über die Datenverarbeitung (Art. 13/14 DSGVO). Bei Cloud-LLM-Wechsel warnt die App aktiv vor Datenweitergabe.
Datenexport & Löschung
Per Klick können Sie alle Ihre Daten exportieren (Art. 15/20 DSGVO) oder vollständig löschen (Art. 17 – Recht auf Vergessenwerden). Volle Kontrolle über Ihre Daten.
Sprechererkennung
Diarization-Plugin erkennt verschiedene Sprecher im Gespräch und ordnet Text-Segmente korrekt zu – ideal für Meetings und Interviews.
Profile & Stile
Diktat, E-Mail, Meeting-Protokoll, ToDo-Liste – wählen Sie das passende Profil und der Text wird automatisch richtig formatiert.
Push-to-Talk & Auto-Insert
Globaler Hotkey in jeder Anwendung. Nach der Transkription wird der Text automatisch in das zuletzt aktive Fenster eingefügt.
Mehrsprachig
Automatische Spracherkennung oder manuelle Auswahl. Optimiert für Deutsch, unterstützt alle von Whisper abgedeckten Sprachen.
Datenminimierung
Nur-Metadaten-Modus für Verlauf: Es werden keine Transkriptionstexte gespeichert, nur Zeitstempel und Profil-Info (Art. 5 Abs. 1c DSGVO).
So funktioniert VoiceFlow Desk
Hotkey drücken
Globaler Shortcut startet die Aufnahme – egal in welcher Anwendung Sie arbeiten.
Sprechen
Diktieren Sie frei. VAD erkennt Sprechpausen und transkribiert live Segment für Segment.
KI optimiert
Text wird bereinigt, formatiert und optional per LLM stilistisch verbessert.
Auto-Insert
Der fertige Text landet automatisch per Clipboard in Ihrem zuletzt aktiven Fenster.
Sicherheit & Datenschutz
VoiceFlow Desk wurde von Grund auf für maximale Datensouveränität entwickelt. Ihre Sprache bleibt, wo sie hingehört: bei Ihnen.
Komplett lokal
Whisper-Modell läuft auf Ihrer Hardware. Keine Audio-Daten verlassen Ihren Rechner – niemals.
DSGVO-Pseudonymisierung
Bei optionaler Cloud-LLM-Nutzung werden personenbezogene Daten (Namen, E-Mail, IBAN, Tel.) automatisch maskiert. Fail-Safe: Bei Fehler wird der Call abgebrochen, nie Klartext gesendet.
Auto-Löschung & Clipboard-Clear
WAV-Dateien werden nach Transkription gelöscht (Art. 5 Abs. 1e). Zwischenablage wird nach 60s automatisch bereinigt – kein Versehen mit sensiblen Inhalten.
Consent & Transparenz
Einwilligungsdialog beim ersten Start (Art. 13/14 DSGVO). Bei Cloud-LLM-Wechsel warnt die App aktiv vor Datenweitergabe. Log-Sanitization entfernt PII aus allen Protokollen.
Betroffenenrechte per Klick
Datenexport (Art. 15/20 DSGVO), vollständige Löschung (Art. 17 – Recht auf Vergessenwerden) und Nur-Metadaten-Modus (Art. 5 Abs. 1c) – alles per Klick erreichbar.
Kein Tracking, kein Abo
Keine Telemetrie, keine Nutzerdaten-Erfassung, kein Subscription-Modell. Einmal-Lizenz, unbegrenzt nutzbar.
Offline-Lizenzierung
Die Lizenzprüfung erfolgt vollständig offline per kryptographischer Signatur. Kein „Phone Home", kein License-Server.
Lokale Datenhaltung
Alle Einstellungen, Verlauf und Sessions in SQLite unter %APPDATA%. Portabler Modus auf USB-Stick möglich.
Made in Germany
Entwickelt in Deutschland, Quellcode unter Ihrer Kontrolle. Optional Self-Hosted LLM via Ollama – null externe Abhängigkeiten.
Für wen ist VoiceFlow Desk?
Anwälte & Steuerberater
Diktieren Sie Schriftsätze, Mandantennotizen und Protokolle – mit automatischer DSGVO-Pseudonymisierung bei Cloud-Nutzung. Kein Wort verlässt Ihre Kanzlei ungefiltert.
- Diktat-Profil mit juristischer Formatierung
- Mandantendaten automatisch maskiert
- Offline-Betrieb für maximale Vertraulichkeit
Ärzte & Therapeuten
Befunde, Arztbriefe und Therapie-Dokumentation per Sprache erfassen. Patientendaten bleiben lokal – keine Cloud-Abhängigkeit.
- Medizinische Fachbegriffe korrekt erkannt
- Patientennamen automatisch pseudonymisiert
- Integration in jede Praxis-Software per Auto-Insert
Geschäftsführer & Projektleiter
Meeting-Protokolle mit Sprechererkennung, E-Mail-Diktate und Aufgabenlisten – alles per Hotkey, ohne Workflow-Unterbrechung.
- Meeting-Profil mit Sprecher-Zuordnung
- ToDo-Erkennung aus freiem Diktat
- Push-to-Talk für schnelle Notizen
Handwerk & Bauleitung
Baustellendokumentation, Mängelberichte und Tagesberichte per Sprache – auch ohne Internet auf der Baustelle.
- Funktioniert ohne Internetverbindung
- Robust auf älteren Rechnern (CPU-Modus)
- Portabler Modus für Baucontainer-PCs
Technische Details
Systemanforderungen
- BetriebssystemWindows 10+ / macOS 12+
- Architekturx64 (Intel/AMD) + ARM64 (Apple Silicon)
- RAMmin. 8 GB (16 GB empfohlen)
- GPU (optional)CUDA für beschleunigte Transkription
- Speicher~500 MB (Modell: small)
- InternetNicht erforderlich
Unter der Haube
- Sprachmodellfaster-whisper (CTranslate2)
- VADSilero VAD (ONNX)
- Diarizationpyannote.audio (Plugin)
- NERspaCy de_core_news_md
- LLM-ProviderOllama / OpenAI / Anthropic
- UI-FrameworkPySide6 (Qt 6)
Bereit, effizienter zu diktieren?
VoiceFlow Desk ist als Einmal-Lizenz erhältlich – kein Abo, keine versteckten Kosten. Vereinbaren Sie eine Demo oder fordern Sie direkt Ihre Lizenz an.