PTO for your hands?!

VON Dr. Wolf SiegertZUM Donnerstag Letzte Bearbeitung: 16. November 2025 um 17h39minzum Post-Scriptum

 

A Speech-to-Text Announcement?

Hier ein Auszug aus dem Microsoft Blog von Yusuf Mehdi, Executive Vice President, Consumer Chief Marketing Officer vom 16. Oktober 2025: Making every Windows 11 PC an AI PC

People are already talking at their PCs every day for dictation and note taking, transcriptions, searching, and with important accessibility features like Voice access and Voice typing. Now, your PC can understand you.

P.S.

In dem eigenen Arbeitsumfeld ist aber bislang noch nicht einmal die Suche nach einem optimalen Voice typing - Programm abgeschlossen - eines, das nicht in der Cloud operiert, wie zum Beispiel transcribe,, ...

Are your solutions only cloud-based, or do you on-premise applications as well?
Our solution is cloud-based. We do have offline transcriptions available for iOS app recording feature - but since it is local it is not as good as cloud-based full-featured transcription.

... sondern on-premise, wie zum Beispiel Dragon. Dort wird für die Version 16 keine Vertriebsmöglichkeit mehr angeboten.

Am 8. Oktober 2025 wurde diese Mitteilung veröffentlicht:

Microsoft Cloud for Healthcare Dragon Copilot
What’s new in Microsoft Dragon Copilot 3.3.2

We’re pleased to announce the general availability of Dragon Copilot in France, Germany, Austria and Ireland. This marks a significant milestone in the expansion of our mission to provide innovative and reliable solutions that enhance productivity, clinician wellbeing, patient experiences and financial impact.
The release of Dragon Copilot 3.3.2, includes a localized product experience for users in these regions tailored to their local needs as well as analytics enhancements for users in the US.

Auf jeden Fall empfiehlt sich vorab diese Lektüre:
Wie schützt Microsoft bei der Verbesserung seiner Spracherkennungstechnologie meine Privatsphäre?
Während alle voreingestellten Stimmen mit Dir reden, als würden sie Dich schon kennen ...

... gelingt auch nach mehrfachen Versuchen die Aktivierung der Mikrofon-Schnittstelle zunächst nicht:

Als zu guter Letzt auch diese Schwierigkeiten ausgeräumt werden konnten, blieb das Ergebnis von der inhaltlichen Seite unbefriedigend. Es entsprach nicht den zuvor von Microsoft selbst vorgegebenen und teils hier schon zitierten Aukünften und Angeboten:

Frage: Gibt es Alternativen? Aus den derzeit vorliegenden Angeboten werden weiterhin in Erwägung gezogen:

Letterly ist ein KI-gestütztes Diktierwerkzeug, das entwickelt wurde, um Ihre Stimme zu transkribieren und in übersichtliche Absätze zu strukturieren. Im Gegensatz zu den meisten Diktiersoftwares, die einfach Sprache-zu-Text-Transkripte erstellen, verwendet Letterly natürliche Sprachverarbeitung (NLP). Diese natürliche Sprachverarbeitung verfeinert das Ergebnis, wenn Sie strukturierte Ergebnisse bevorzugen, ohne von Grund auf neu bearbeiten zu müssen.
Hauptfunktionen
Intelligente Absatzstrukturierung: Letterly organisiert diktierte Sprache automatisch in sinnvolle Absätze, korrigiert den Fluss und die Satzstruktur für einen sauberen, sofort verwendbaren Entwurf.
Ton- und Klarheitsverbesserung: Letterly wendet subtile Verfeinerungen an Ton, Grammatik und Formulierung an, was das erstellte Transkript natürlich und gut konstruiert klingen lässt.
Einfache Diktieroberfläche: Bei Letterly können Sie sofort mit minimalem Aufwand diktieren. Die Benutzeroberfläche ist ablenkungsfrei und für kontinuierliche Spracheingabe optimiert.
Export- und Freigabeoptionen: Sobald das strukturierte Transkript fertig ist, können Sie es sogar als Text exportieren oder direkt per E-Mail versenden.
Vorteile:
Formatiert Diktate automatisch in saubere Absätze
Ideal für Content-Ersteller und Gedankenstücke
Leichte und minimale Benutzeroberfläche
Nachteile:
Fehlt Echtzeit-Kollaborationsfunktionen
Begrenzte Sprachunterstützung
Nicht geeignet für Meetings oder Interviews mit mehreren Sprechern
Am besten geeignet für: Letterly ist ideal für Benutzer, die ihre langformatigen Sprachdiktate in strukturierten, veröffentlichungsfertigen Text umwandeln möchten.

Dieser Text findet sich auf der Webseite des konkurrierenden Anbieters transkriptor - was für diesen spricht:

Wie Transkriptor Audio in Text umwandelt
Transkriptor ist ein KI-Transkriptionstool, das Audio- oder Videodateien analysiert, um Transkripte mit 99% Genauigkeit zu erstellen. Es unterstützt über 100 Transkriptions- und Übersetzungssprachen und kann lange Transkripte in gut strukturierten Text zusammenfassen. Es ist viel erschwinglicher als Microsoft Copilot und kostet nur 4,99 $ pro Monat.

Aber dann stellt sich im direkten Dialog mit den Anbietern heraus, dass diese Software keine on-premise-Lösung anbietet und die eingesprochenen Texte nicht direkt in Word dargestellt werden können :-( ...

Maria von Letterly schreibt am Freitag, dem 14.11.2025 08:51:

Hi Wolf,
Thank you for the thoughtful questions – here are clear answers to each one:
1. Do we provide an on-premise solution?
At the moment, Letterly does not offer an on-premise or self-hosted version.
We run entirely in the cloud so we can keep all features tightly integrated, updated, and secure.
(We do take data privacy seriously: recordings are stored in an anonymized form, encrypted, and never used to train models.)
2. Can you dictate directly into a Word file?
Yes – on macOS.
If you use Letterly on Mac (version 2.1.1 ), you can use our system-wide dictation, which lets you dictate into any text field, including:
• Microsoft Word
• Pages
• Google Docs
• Email clients
• Browsers
• Chat windows
Just place your cursor in Word and start dictating.
On iOS and Android: direct dictation into Word is not available yet, but it’s already being developed for iOS.
3. Can you integrate your Dragon library?
Unfortunately, Letterly cannot import or integrate Dragon libraries (vocabulary, macros, commands).
The systems have completely different architectures, so Dragon-specific resources can’t be transferred.

Zuvor gab es am Mittwoch, den 5. November 2025, um 12:00 Uhr, ein Online-Meeting mit Berkay K. in dessen Verlauf aber ebenfalls die hier vorgetragenen Wünsche nicht erfüllt werden konnten. Auch das nachfolgende Anschreiben vom 9. November 2025, 03:34 Uhr, konnte daran nichts ändern:

I hope this message finds you well. I’m Siyar Isik, the CEO of Transkriptor, and I wanted to personally reach out to you. I noticed that you haven’t had the chance to explore Transkriptor yet, and we genuinely miss having you with us.

Ebenfalls für diese Zwecke nicht geeignet:
 https://otter.ai/
 https://sonix.ai/
[:::]

Auch die letzte noch verbliebene Alternative erfüllt nicht die eigenen Anforderungen_
 turboscribe.ai verspricht;

Convert Audio to Word (DOCX). Convert audio recordings into Microsoft Word documents for free.

Aber auch hier geht diese nur mit zuvor erstellten Audio-Files...