Discussion:
Mitschneiden von Sprache-zu-Text
(zu alt für eine Antwort)
Andreas M. Kirchwitz
2024-03-30 16:43:22 UTC
Permalink
Hallo Android-Nutzer!

Kann mir jemand Apps empfehlen, wo das Smartphone dem normal im
Alltag gesprochenen Wort lauscht und das in Text umwandelt und in
einem Textdokument mitschreibt?

Ich wollte letztens eine tolle Textpassage aus einem Film gern
als Text haben. Bisher tippe ich sowas von Hand mit. Die sprechen
halt normal schnell, man muss sich die Stelle dann mehrmals
anhören, bis man korrekt alles hat. Und da dachte ich, warum
kann das im Jahr 2024 nicht mein Smartphone für mich machen. :-)

Die Umwandlung muss nicht Echtzeit sein. Die App kann auch erst
mitlauschen und dann anschließend in Ruhe den Text erzeugen.
Es darf auch cloud-basiert sein und muss nicht lokal geschehen.

Naiv war mein erster Gedanke, ich öffne eine Keep-Notiz und drücke
im Google-Keyboard aufs Mikrofon. Äh, nein, da muss man immer sehr
langsam und deutlich reden, außerdem schaltet das nach ein paar
Sekunden oder bei Pausen von allein ab.

Im Netz gibt es so Listen der besten Transcribe-Apps, da wurde
z.B. "Otter" viel gelobt. Das funktioniert gut, bloß leider nur
mit englischer Sprache. Deutsch wäre aber das, was ich (auch)
gern hätte.

Andere Apps haben sagenhafte Abo-Modelle im dreistelligen Bereich.
Bitte kein Abo, und auch bitte keine Werbung. Ein paar Euro bin
ich einmalig bereit zu zahlen, aber kein Wucher. Ich hätte das
gern privat, und wenn's das nicht gibt, tippe ich eben weiterhin
selbst mit wie bisher. :-)

Angeblich solle Google Docs wohl so eine Funktion mitbringen,
doch dort habe ich nichts gefunden, um Text zu diktieren.
Außerdem will ich ja nichts diktieren und dabei sprechen
wie ein Depp, sondern ich will's z.B. an den Lautsprecher
halten, und da habe ich keinen Einfluss, wie schnell gesprochen
wird oder wie lang Pausen gemacht werden.

Mein Smartphone bietet intern auch allerlei Unterstützung von
Menschen mit Behinderungen. Da dachte ich, wenn jemand nicht gut
hören kann, vielleicht gibt's da was, doch habe nichts gefunden.
Vielleicht liegt's an meinen Augen, wer weiß...

Vielleicht sehe ich den Wald vor Bäumen nicht.

Grüße, Andreas
Joerg Walther
2024-03-30 17:07:59 UTC
Permalink
Post by Andreas M. Kirchwitz
Ich wollte letztens eine tolle Textpassage aus einem Film gern
als Text haben.
Dann würde ich statt einer App eine der üblichen Untertiteldownloadsites
des Interweb benutzen.

-jw-
--
And now for something completely different...
Wendelin Uez
2024-03-30 18:54:58 UTC
Permalink
Post by Andreas M. Kirchwitz
Kann mir jemand Apps empfehlen, wo das Smartphone dem normal im
Alltag gesprochenen Wort lauscht und das in Text umwandelt und in
einem Textdokument mitschreibt?
Die meisten Android-Tastaturen bieten eine Mikrophon-Taste, über die man
Sprache zu Text konvertieren kann. Das funktioniert sehr gut, und zwar
überall dort, wo die Tastatur aufgerufen wird, also in jeder App, die eine
Texteingabe verlangt.

Aus unerfindlichen Gründen hat Google allerding die Umwandlung von
Befehlsworten in Befehle, also sowas wie "neuer Absatz" in ENTER, oder
"Punkt" in einen Punkt, nicht im deutschen Sprachpack eingebaut. Angeblich
soll es ab Android 12 drin sein, ist es aber zumindest bei Samsung nicht.
Völlig idiotisch, angesichts der sonst recht gut funktionerenden
Spracherkennung.
Torsten Villnow
2024-03-31 10:34:47 UTC
Permalink
Post by Wendelin Uez
Post by Andreas M. Kirchwitz
Kann mir jemand Apps empfehlen, wo das Smartphone dem normal im
Alltag gesprochenen Wort lauscht und das in Text umwandelt und in
einem Textdokument mitschreibt?
Die meisten Android-Tastaturen bieten eine Mikrophon-Taste, über die man
Sprache zu Text konvertieren kann. Das funktioniert sehr gut, und zwar
überall dort, wo die Tastatur aufgerufen wird, also in jeder App, die
eine Texteingabe verlangt.
Aus unerfindlichen Gründen hat Google allerding die Umwandlung von
Befehlsworten in Befehle, also sowas wie "neuer Absatz" in ENTER, oder
"Punkt" in einen Punkt, nicht im deutschen Sprachpack eingebaut.
Angeblich soll es ab Android 12 drin sein, ist es aber zumindest bei
Samsung nicht. Völlig idiotisch, angesichts der sonst recht gut
funktionerenden Spracherkennung.
Die Samsung-Tastatur auf dem S24+ mit Android 14 kann Punkt und Komma
"richtig" umsetzen.
--
Torsten Villnow
Andreas M. Kirchwitz
2024-03-31 14:09:56 UTC
Permalink
Post by Wendelin Uez
Die meisten Android-Tastaturen bieten eine Mikrophon-Taste, über die man
Sprache zu Text konvertieren kann. Das funktioniert sehr gut, und zwar
überall dort, wo die Tastatur aufgerufen wird, also in jeder App, die eine
Texteingabe verlangt.
Das hatte ich wie beschrieben probiert. Google Keyboard verwende ich.
Es ist leider ungeeignet, normal gesprochenes Wort aufzuzeichnen,
denn es reagiert überhaupt nicht auf normale Sprache, sondern man
muss unnatürlich langsam und deutlich sprechen. Sobald eine kurze
Pause kommt, bricht es zudem automatisch ab.

Anscheinend haben spezielle Transcribe-Apps ihre Berechtigung,
doch ich habe bisher keine gefunden, die auch deutsche Sprache
beherrscht und preislich auf Privatpersonen zugeschnitten ist.

Grüße, Andreas
Wendelin Uez
2024-04-01 11:18:49 UTC
Permalink
Post by Andreas M. Kirchwitz
Das hatte ich wie beschrieben probiert. Google Keyboard verwende ich.
Es ist leider ungeeignet, normal gesprochenes Wort aufzuzeichnen,
denn es reagiert überhaupt nicht auf normale Sprache, sondern man
muss unnatürlich langsam und deutlich sprechen. Sobald eine kurze
Pause kommt, bricht es zudem automatisch ab.
Ich nutze die normale Samsung-Tastatur auf Android 11. und 12-Geräten. Bei
beiden funktioniert die Spracherkennung recht gut, und auch verhältnismäßig
schnell gesprochene Sätze werden oft überraschend sauber transkribiert.

Lediglich die Satz- und Formatierzeichen machen Probleme. Auf dem 11er
funktionieren "Punk" und "Komma" nur manchmal, auf dem 12er meistens.
Anweisungen wie "neue Zeile", "löschen" etc. auf beiden nie. Die
gesprochenen Worte werden jedoch immer einwandfrei erkannt, es ist also nur
eine mutwillige Unterlassung, sie auch zu übersetzen - wer die Zeichenfolge
"Punkt" ausgeben kann, der kann auch "." ausgeben, und wer "neue Zeile"
erkennt, der kann stattdessen auch ein CR/LF ausgeben.

Ob das nun die Tastatur-App macht oder, was zu vermuten ist, eine von der
App aufgerufene Funktion in Android, spielt dabei keine Rolle. Wäre es die
Tastatur-App, gäbe es wahrscheinlich bereits passend erweiterte Apps dafür.
Gibt es aber m.W. keine.
Arno Welzel
2024-04-01 14:47:36 UTC
Permalink
Post by Andreas M. Kirchwitz
Post by Wendelin Uez
Die meisten Android-Tastaturen bieten eine Mikrophon-Taste, über die man
Sprache zu Text konvertieren kann. Das funktioniert sehr gut, und zwar
überall dort, wo die Tastatur aufgerufen wird, also in jeder App, die eine
Texteingabe verlangt.
Das hatte ich wie beschrieben probiert. Google Keyboard verwende ich.
Es ist leider ungeeignet, normal gesprochenes Wort aufzuzeichnen,
denn es reagiert überhaupt nicht auf normale Sprache, sondern man
muss unnatürlich langsam und deutlich sprechen. Sobald eine kurze
Pause kommt, bricht es zudem automatisch ab.
Kann ich nicht bestätigen - Google Pixel 6a und QuickEdit. Ich habe den
Absatz oben von Dir einfach mal testweise normal eingesprochen, so wie
ich es jemandem auch sonst vorlesen würde. Das Ding hat alle Wörter
komplett fehlefrei erkannt, selbst die, bei denen ich undeutlich
gesprochen hatte.

Eventuell brauchst Du einfach nur ein neueres oder leistungsfähigeres
Gerät. Google nutzt bei den neueren Pixel-Modellen (ab Pixel 6) eine
"TPU" (Tensor Processing Unit), um antrainierte neuronale Netze für
diverse Zwecke in Software nutzen zu können. Damit spart man sich
einerseits die Notwendigkeit eines Servers für Spracherkennung und das
dürfte auch zur guten Erkennung beitragen. Das Pixel 6a gibt es
gebraucht für deutlich unter 300 EUR und es bekommt noch einige Jahre
offiziell Updates von Google und kann später ggf. auch mit LineageOS
genutzt werden.
--
Arno Welzel
https://arnowelzel.de
Arno Welzel
2024-04-01 14:42:27 UTC
Permalink
Post by Andreas M. Kirchwitz
Kann mir jemand Apps empfehlen, wo das Smartphone dem normal im
Alltag gesprochenen Wort lauscht und das in Text umwandelt und in
einem Textdokument mitschreibt?
Text-Editor, Google-Tastatur benutzen und deren Spracherkennung aktivieren?
Post by Andreas M. Kirchwitz
Ich wollte letztens eine tolle Textpassage aus einem Film gern
als Text haben. Bisher tippe ich sowas von Hand mit. Die sprechen
halt normal schnell, man muss sich die Stelle dann mehrmals
anhören, bis man korrekt alles hat. Und da dachte ich, warum
kann das im Jahr 2024 nicht mein Smartphone für mich machen. :-)
Die Umwandlung muss nicht Echtzeit sein. Die App kann auch erst
mitlauschen und dann anschließend in Ruhe den Text erzeugen.
Das passiert bei Android immer in Echtzeit, wenn das Gerät einigermaßen
aktuell ist also nicht älter als ein paar Jahre.
Post by Andreas M. Kirchwitz
Naiv war mein erster Gedanke, ich öffne eine Keep-Notiz und drücke
im Google-Keyboard aufs Mikrofon. Äh, nein, da muss man immer sehr
langsam und deutlich reden, außerdem schaltet das nach ein paar
Sekunden oder bei Pausen von allein ab.
Also ich kann da recht normal reinsprechen und das Ding erkennt alles.
Mag aber sein, dass eine Aufnahme per Mikro von einem Lautsprecher im
Fernseher oder Computer hier nicht so gut funktioniert.

[...]
Post by Andreas M. Kirchwitz
Andere Apps haben sagenhafte Abo-Modelle im dreistelligen Bereich.
Ja - wer sowas nutzt, macht das nicht selten zum Einkommenserwerb.
Entsprechend kostet das dann meist auch was.
Post by Andreas M. Kirchwitz
Bitte kein Abo, und auch bitte keine Werbung. Ein paar Euro bin
ich einmalig bereit zu zahlen, aber kein Wucher. Ich hätte das
gern privat, und wenn's das nicht gibt, tippe ich eben weiterhin
selbst mit wie bisher. :-)
Abo ist bei vielen Diensten mittlerweile normal, weil vom *einmaligen*
Verkauf einer App für ein paar EUR kann niemand sowas ernsthaft
finanzieren. Selbst wenn die App nach einigen Jahren 100.000 Benutzer
haben sollte, reicht das nicht, um *dauerhaft* eine Firma mit mehreren
Entwicklern fest zu finanzieren.
Post by Andreas M. Kirchwitz
Angeblich solle Google Docs wohl so eine Funktion mitbringen,
doch dort habe ich nichts gefunden, um Text zu diktieren.
Das macht auch nicht Google Docs, sondern die Tastatur-App oder unter
Windows halt die dortige Spracherkennung.
--
Arno Welzel
https://arnowelzel.de
Loading...