Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Warum Sprachassistenten sich so langsam weiterentwickeln

Vergleicht man die Fotoqualität aktueller Smartphones mit Geräten, die noch vor wenigen Jahren auf dem Markt waren, so werden direkt immense Verbesserungen sichtbar. Auch Prozessoren und andere Chips entwickelten sich sehr rasch weiter und die Branche kann Jahr für Jahr mit immer leistungsfähigeren Systemen antreten. In einem Bereich blieben Innovationen allerdings weitgehend aus - nämlich bei den integrierten Mikrofonen. Noch immer gibt es große Probleme, Störgeräusche wirkungsvoll herauszufiltern sowie Stimmkommandos in jener Präzision aufzunehmen, wie sie für leistungsfähige Sprachassistenten erforderlich wäre. Einem Bericht von Bloomberg zufolge ist dies einer der wesentlichen Gründe, warum Dienste wie Siri, Cortana oder Alexa nur geringe Fortschritte machen.


Wenig Fortschritt, auch beim iPhone
Peter Cooney von SAR Insight & Consulting weist darauf hin, dass zwar viele Unternehmen an besseren Produkten forschen, sich dennoch wenig tue. Seit dem iPhone 5 habe sich das integrierte Mikrofon des iPhones beispielsweise kaum weiterentwickelt. Allerdings setzte bei den großen Technologiekonzernen inzwischen ein Umdenken ein und Mikrofone genießen deutlich höheren Stellenwert, als es noch vor wenigen Jahren der Fall war. So forsche unter anderem Apple daran, Störquellen bei der Aufnahme wirkungsvoll auszublenden.

Apple erkennt Wichtigkeit guter Mikrofone
Kürzlich hatte sich Apples Software-Chef Craig Federighi ebenfalls zu Siri und der erforderlichen Technologie geäußert. Dabei hob er hervor, wie wichtig beispielsweise die Platzierung des Mikrofons sei - und auch die Abstimmung der erforderlichen Chips. Apples Fähigkeit, Hardware und Software aus einer Hand zu liefern, könne hier als großer Vorteil gegenüber reinen Software-Anbietern gesehen werden, so Federighi. Der Bloomberg-Artikel, in dem zahlreiche Spezialisten zu Wort kommen, zeigt jedoch, wie viel es dennoch zu tun gäbe. Eine vielversprechende, neue Technologie soll ab Mitte kommenden Jahres Marktreife erlangen. Ein Piezoelement soll dabei Audiosignale umwandeln und die Qualität maßgeblich verbessern.

Kommentare

piik
piik26.08.16 12:11
fen
Mindestens genauso wesentlich ist aber die eingesetzte Mikrofon-Technologie...
Sie ist zwar nicht unwichtig, aber die Gleichstellung ist schlicht falsch, aber das richtig gründlich. Die Software-Technologie ist sehr viel wichtiger als alles Andere. Z.B. lässt sich an eine sturen technischen Verbesserung der Mikrofone und Anordnung und primärer Verrechnung eben wirklich kaum noch was verbessern, daher der "mangelnde Fortschritt" hier. Da hilft auch kein "Piezoelement", was immer das auch sein soll (ein spezielles Mikro wohl).
Zentral ist die Software. Nur mit ihr wird man bei der Sprachanalyse eine ähnliche Qualität des "Heraushörens" einer Stimme aus Umweltgeräuschen hinbekommen, wie es Menschen können. Und das hat nichts mit den Mikros zu tun, gar nichts.
Das ist eine Frage von Rechenleistung, Algorithmen und psychoakustischer Forschung.
0
shabanac26.08.16 12:16
@piik Und das weißt Du woher mein Grosser...;-)???
0
Black Mac
Black Mac26.08.16 12:22
Ich habe ausserdem das Gefühl, dass wir mit der deutschen Sprache hinterherhinken. Dieses Genuschel, das die Apple-Fuzzis Siri an den Keynotes zumuten, würde in Deutsch niemals funktionieren. Oder es ist alles Fake, was mich nicht wundern würde – denn die Peinlichkeit einer falschen Interpretation durch Siri würde sich Apple nie geben.
P.S.: Apple kann keine Dienste.
0
orion26.08.16 12:26
in den 70ern gab es schon Piezohöchtöner (also genau anders herum) und die waren das grottenschlechteste was man in seine Boxen einbauen konnte (äh, ja damals hat man Boxen noch selbst gebaut )
0
nopeecee
nopeecee26.08.16 12:29
Ich finde das Verstehen ist kaum noch ein Problem, aber die blöden Antworten sind eins
Auch in Foren kann man höflich miteinander umgehen
0
thomas b.
thomas b.26.08.16 12:34
orion
in den 70ern gab es schon Piezohöchtöner (also genau anders herum) und die waren das grottenschlechteste was man in seine Boxen einbauen konnte (äh, ja damals hat man Boxen noch selbst gebaut )

Ja, die guten alten Piezos, sehr billig, hoher Schalldruck und das wars aber auch, die hatte ich seinerzeit beim Lautsprecherbau strikt vermieden.

Zurück zum Thema, ein Mikrofon nimmt Umgebungsgeräusche eben mit auf, so gut oder so schlecht wie den Nutz-Ton. Ein in dieser Hinsicht nützliches Richtmikrofon im Smartphone geht wohl nicht so einfach.
0
Moogulator
Moogulator26.08.16 13:38
Die zu unflexible Wortwahl ist das große Problem, sowie das verschiedene Sprachen ein Problem sind, was bei Bandnamen besonders die Nutzung von Siri erschweren.

Es wäre gut, wenn es mehr als einen möglichen Satz gibt, um Termine, Wecker und Co. zu steuern.

Fehlende "Intelligenz" ist es, was mich mehr stört..
Ich habe eine MACadresse!
0
piik
piik26.08.16 13:56
shabanac
@piik Und das weißt Du woher mein Grosser...;-)???
So kriegst Du sicher keine Antwort, aber die wolltest Du ja auch nicht.
0
rafi26.08.16 14:03
Schall ist eben nicht Licht.

Im Grund genommen ist ein schnödes Mikrofon das Equivalent zum einzelnen Pixel auf dem Kamerasensor.
Aber da hört es schon auf.

Es ist zwar möglich, mit mehreren Mikrofonen eine Quelle zu Orten und alles drum rum zu ignorieren, aber das geschieht über die unterschiedlichen Latenzen (wie beim nauronalen hören), also über die Abstände zwischen den beiden Mikrofonen und dem der unterschiedlichen Zeit, die der Ton da hin braucht.
Man könnte vielleicht den Displayrahmen mit Mikrofonen versehen.
So einfach wie ein Chip einbauen ist das halt nicht.
0
steinb_i26.08.16 15:04
Black Mac
Oder es ist alles Fake, was mich nicht wundern würde – denn die Peinlichkeit einer falschen Interpretation durch Siri würde sich Apple nie geben.

Klar ist das Fake. Manchmal steht ja der erkannte Satz schon auf der Leinwand bevor er fertig gesprochen wurde.
0
Michael Lang26.08.16 16:19
Mikrophone mögen wichtig sein, aber an sich liegt es doch eher an der Erkennung und die ist sicherlich nicht primär abhängig von der Aufnahmequalität. Umgebungsgeräusche sind natürlich ein Problem, da muß man Filtertechniken entwickeln.

Aber die Erkennung ist auch bei absolut stiller Umgebung nicht perfekt, weil die Spracherkennung eben nicht ausreichend ist. Nicht jedes Wort kann interpretiert werden, nicht jede Aussprache (zB. Ob ein Bayer spricht, ein Österreicher oder ein Ostfriese) deutlich erkannt.
Das liegt an mangelnder Logik. Das läßt sich nur durch stark verbesserte algotithmen lösen. Ebenso wie die Antwortmöglichkeiten.

Da sehe ich eher den Schwerpunkt.

Aber vielleicht verstehe ich das einfach nur nicht so recht....

Michael
- Das größte Maul und das kleinste Hirn,wohnen meist unter derselben Stirn. - Hermann Oscar Arno Alfred Holz, (1863 - 1929), deutscher Schriftsteller
0
Michael Lang26.08.16 16:19
Mikrophone mögen wichtig sein, aber an sich liegt es doch eher an der Erkennung und die ist sicherlich nicht primär abhängig von der Aufnahmequalität. Umgebungsgeräusche sind natürlich ein Problem, da muß man Filtertechniken entwickeln.

Aber die Erkennung ist auch bei absolut stiller Umgebung nicht perfekt, weil die Spracherkennung eben nicht ausreichend ist. Nicht jedes Wort kann interpretiert werden, nicht jede Aussprache (zB. Ob ein Bayer spricht, ein Österreicher oder ein Ostfriese) deutlich erkannt.
Das liegt an mangelnder Logik. Das läßt sich nur durch stark verbesserte algotithmen lösen. Ebenso wie die Antwortmöglichkeiten.

Da sehe ich eher den Schwerpunkt.

Aber vielleicht verstehe ich das einfach nur nicht so recht....

Michael
- Das größte Maul und das kleinste Hirn,wohnen meist unter derselben Stirn. - Hermann Oscar Arno Alfred Holz, (1863 - 1929), deutscher Schriftsteller
0
Advokat
Advokat26.08.16 20:28
Meiner Erfahrung nach liegt es an der Software und der Rechenleistung und nur wenig am Mikrofon. Ich denke, jeder der schon mal längere Zeit mit der Spracherkennungssoftware bzw. Diktiersoftware von Dragon im Vergleich zu Siri, Cortana, etc. gearbeitet hat wird mir da zustimmen.
0
iKurt
iKurt30.08.16 08:25
Es kann nicht an den derzeit verbauten Mikrofonen liegen das Siri eine schlechte Spracherkennung hat, denn mit dem Google Suchen App funktioniert die Erkennung der Sprache jedes mal tadellos wo sie bei Siri nicht richtig erkannt wird, auf dem gleichem Gerät!

Ich sehe es daher wie piik, es ist eine Sache der Software.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.