Cortana und Skype-Übersetzer: Auch bei Microsoft werten Mitarbeiter Sprachaufnahmen aus

Ebenso wie Apple, Google und Amazon setzt auch Microsoft auf menschliche Unterstützung bei der Auswertung von gesprochenen Texten. Um die Fähigkeiten sowohl von Cortana als auch des Skype-Translators zu verbessern, überprüfen Mitarbeiter des Unternehmens deren Erkennungs- und Übersetzungsleistung. Dabei kommen ihnen gelegentlich intime Details zu Ohren.


Aufnahmen von fünf bis zehn Sekunden
Dem Magazin Motherboard wurden jetzt Dokumente, Screenshots und Audioaufnahmen zugespielt, aus denen hervorgeht, dass externe Mitarbeiter des Softwarekonzerns Teile von Gesprächen auswerten. Dabei handelt es sich um kurze Ausschnitte mit einer Länge von fünf bis zehn Sekunden, allerdings können die Aufnahmen auch länger sein. Gleichzeitig mit den Audiodateien erhalten die Mitarbeiter vom System erstellte Übersetzungsvorschläge, aus denen sie dann den treffendsten auswählen sollen.


Intime Details und privateste Unterhaltungen
Zwangsläufig enthalten die Aufnahmen des Skype-Übersetzers mitunter Teile von äußerst privaten Unterhaltungen. In dem Motherboard vorliegenden Material ist etwa Liebesgeflüster zu hören, aber auch Gespräche über Gewichtsverlust oder Beziehungsprobleme sowie Unterhaltungen mit eindeutig sexuellem Bezug. In Befehlen an Cortana tauchen darüber hinaus zuweilen vollständige Adressen auf.

Kryptische Erklärungen von Microsoft
Microsoft weist im englischen Original der FAQ zum Skype-Translator zwar darauf hin, dass gesprochene Sätze und automatische Transkriptionen analysiert und Korrekturen ins System eingegeben werden. Allerdings ist nicht ausdrücklich die Rede davon, dass dies durch Mitarbeiter geschieht. Die deutsche Version des gesamten FAQ-Textes ist weitgehend unverständlich, da es sich bei dieser um eine der bei Microsoft häufig vorkommenden automatischen Übersetzungen handelt.

"Stets mit Zustimmung der Nutzer"
Die Mitarbeiter, welche die Transkriptionen anfertigen, arbeiten teilweise von zu Hause aus. Microsoft erklärte gegenüber Motherboard, man bemühe sich bei der Auswertung von Sprachdaten um größtmögliche Transparenz. Die Analyse von Aufnahmen geschehe darüber hinaus stets mit der Zustimmung des Nutzers. Zudem würden die Daten anonymisiert und die Mitarbeiter erhielten die Audiodateien ausschließlich über ein spezielles gesichertes Online-Portal.

Apple und Google setzen Auswertung aus
Microsoft ist nach Apple, Google und Amazon das vierte Unternehmen, von dem bekannt wird, dass es Sprachaufzeichnungen von Mitarbeitern analysieren lässt. Der iPhone-Hersteller und der Suchmaschinen-Konzern haben diese Praxis mittlerweile bis auf Weiteres ausgesetzt. Der Onlinehändler gibt den Nutzern seines Sprachassistenten in der Alexa-App seit kurzem die Möglichkeit, die Auswertung abzuschalten. Ob Microsoft ähnliche Schritte für den Skype-Übersetzer und Cortana in Erwägung zieht, ist nicht bekannt.

Kommentare

MikeMuc08.08.19 10:37
Na sowas, das hat aber auch wirklich keiner ahnen können
Wie soll der Kram den verbessert werden wenn man nicht genau die "Gespräche" analysiert bei denen der Assistent nix mit anfangen konnte. Und dazu muß sich irgendwer den Mist anhören und dann entscheiden: Sollte ignoriert / rausgefiltert werden oder "hier müssen wir nachbessern" und "Antworten finden / liefern".
0
nane
nane08.08.19 11:17
Das erhöht das Vertrauen in moderne "Assistenzdienste" sicher enorm. Wobei, bei WhatsApp regt sich auch nur der Nerd um die Ecke auf
Das Leben ist ein langer Traum an dessen Ende kein Wecker klingelt.
-1
sierkb08.08.19 11:55
nane
Das erhöht das Vertrauen in moderne "Assistenzdienste" sicher enorm.

Welt (05.08.2018): Amazon schickt Alexa-Gespräche an Heimarbeiter in Polen
Millionen von Alexa-Sprachbefehlen werden von Zeitarbeitern in Polen ausgewertet – und das auch in Heimarbeit. Nutzerdaten sind dabei praktisch ungeschützt. Amazon zieht jetzt die Notbremse.

FAZ (04.08.2019): Datenschutz: Deutsche Alexa-Sprachbefehle werden von polnischen Heimarbeitern abgehört
Amazon lässt Zeitarbeiter in Polen deutsche Aufzeichnungen des Digitalassistenten auswerten, um die Spracherkennung zu optimieren. Viele arbeiten dabei vom eigenen Küchentisch aus. Datenschützer warnen vor hohem Risiko für die Privatsphäre.

Bei Apple läuft's im Prinzip nicht anders, wie Whistleblower in den letzten Tagen an die Öffentlichkeit gebracht und haben durchblicken haben (dort werden die Gespräche und Daten dem Vernehmen nach jeweils sogar mit verschiedenen Metadaten ergänzt bzw. um diese ergänzt).


SZ (04.08.2019): Alexa, Siri und Google: Sprachassistenten verlieren ihre menschlichen Ohren
  • Bei Siri und Google hören keine Menschen mehr zu, wenn Nutzer mit den Sprachassistenten reden.
  • Wer Alexa verwendet, muss selbst aktiv werden, um zu verhindern, dass ein Teil der Aufnahmen von Mitarbeitern überprüft wird.
  • Mehrere Enthüllungen hatten die Unternehmen unter Druck gesetzt, auch der Hamburger Datenschutzbeauftragte ermittelt.
  • Der Skandal ist nicht, dass Menschen zuhören, sondern dass Amazon, Apple und Google dieses Vorgehen jahrelang verschwiegen haben.


SZ, 04.08.2019
[…]
Die drei Unternehmen haben damit offenbar auf den öffentlichen Druck reagiert, den Enthüllungen der vergangenen Monate ausgelöst hatten. Mehrere Medienberichte hatten offenbart, dass hinter Sprachassistenten nicht nur künstliche, sondern auch menschliche Intelligenz steckt: Tausende Mitarbeiter hören die Aufzeichnungen ab und korrigieren die automatischen Transkripte. Damit trainieren sie die Maschinen und verbessern die Qualität der Spracherkennung.

Amazon, Apple und Google haben diese Praxis jahrelang verheimlicht und in vagen Datenschutzerklärungen versteckt. Besonders problematisch ist, dass die Mikrofone weniger zuverlässig funktionieren, als die Hersteller suggerieren. Die Sprachassistenten lauschen auf bestimmte Aktivierungsworte wie "Alexa" oder "Hey Google". Doch manchmal reichen "Alexandra" oder "Hey Kuchen", um die Maschinen durcheinander zu bringen. Siri fühlt sich vom Zip-Geräusch eines Reißverschlusses angesprochen. Dann startet die Aufzeichnung, und oft bekommen die Nutzer nichts davon mit.

Die Unternehmen versuchen, die Pannen herunterzuspielen. Sie sprechen von Einzelfällen, nennen aber keine konkreten Zahlen. Medienberichte legen nahe, dass Fehlalarme häufiger vorkommen. Von etwa 1000 Aufnahmen, die dem flämischen Sender VRT zugespielt wurden , seien rund 150 versehentlich auf Googles Servern gelandet. Die Agentur Bloomberg nennt einen Anteil von zehn Prozent unbeabsichtigter Alexa-Aktivierungen. Auch zwei Apple- und ein Google-Mitarbeiter sagten der SZ, dass sie immer wieder Aufnahmen abgehört hätten, die Nutzer offenbar unbewusst ausgelöst hätten.

Immer wieder sollen sensible Momente eingefangen worden sein […]

Amazon, Apple und Google ließen Nutzer im Unklaren

Solche Enthüllungen empören viele Menschen und lösen Angst und Verunsicherung aus. Der eigentliche Skandal liegt aber nicht darin, dass die Unternehmen Mitarbeiter beschäftigen, um die automatische Spracherkennung zu optimieren. Vor allem verdienen Amazon, Apple und Google Kritik, weil sie ihre Nutzer völlig unzureichend darüber aufgeklärt haben. Wer weiß, wie maschinelles Lernen funktioniert, konnte ahnen, dass er menschliche Mithörer hat. Doch ein Großteil der Hunderten Millionen Menschen, die Sprachassistenten nutzen, war völlig ahnungslos.

Insofern kommen die Reaktionen der drei Tech-Unternehmen zwar Jahre zu spät, sind aber ein Schritt in die richtige Richtung…

[…]

Unternehmen reagieren erst auf Skandale und öffentlichen Druck

Aus Sicht der Unternehmen mag es wünschenswert sein, dass möglichst viele Nutzer ihre Sprachaufnahmen freigeben. Jahrelang haben sie auf eine Strategie der Desinformation gesetzt und fehlenden Widerspruch als Zustimmung gewertet. Facebook macht das ähnlich: Wer nicht will, dass Daten gesammelt werden, muss selbst aktiv werden.

Der Mensch ist ein Gewohnheitstier, und Unternehmen nutzen das aus. Gegen manipulatives Design und die Macht der Standardeinstellungen konnten bislang auch Datenschutzgesetze wie die DSGVO nichts ausrichten. Die vergangene Woche hat gezeigt, was helfen kann: journalistische Enthüllungen und öffentlicher Druck.
+4
johnnytravels
johnnytravels08.08.19 12:51
Der Skandal ist, dass die Unternehmen nicht eine eigene, ständige Abteilung dafür beschäftigen (die natürlich kosten würde), sondern das Material billigbillig an Zuarbeiter rausgeben, mit hoher Fluktuation und verständlicherweise niedrigem commitment seitens der Zuarbeitenden.
Von Amazon war das zu erwarten (weil selbst billigbillig), von Google auch irgendwie (weil denen Datenschutz einfach wurst ist), bei Microsoft kommt es einem weniger wahrscheinlich vor (subjektiv, die kommen mir manchmal noch so vor als hätten sie eine eigene Hauspoststelle mit braunen Umschlägen) und bei Apple schließlich mit ihrem ganzen ‚Datenschutzdatenschutz‘-Brimborium ist es einfach nur unter aller Sau.
‚Tim Cook ist kein Produkt-Mensch.‘ — Steve Jobs
+2
Pixelmeister09.08.19 00:45
Ich bin nach wie vor überrascht über die große Aufregung bei dem Thema. NATÜRLICH können nur Menschen dafür sorgen, dass die KIs einen immer besser verstehen. Wer soll denn sonst der KI sagen, dass sie etwas falsch verstanden hat? Eine andere KI? Und wenn die 2. KI soviel schlauer ist, warum verwendet man die nicht gleich?

Im Prinzip ist es doch egal, ob eine KI meinen Sex-Talk mithört oder ein schlecht bezahlter Mitarbeiter in Polen oder Vietnam. Viel wichtiger ist es, dass es gar nicht dazu kommt, dass ungewollt Sprachaufnahmen gemacht werden. Ich z.B. starte Siri nur über den iPhone-Homebutton oder die entsprechende Taste am Lenkrad. Wie macht man das bei Alexa?
-1

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.

OK MacTechNews.de verwendet Cookies unter anderem für personalisierte Inhalte, Seitenanalyse und bei der Auslieferung von Google-Anzeigen. Dies war zwar schon immer so, auf Wunsch der EU muss nun jedoch explizit darauf hingewiesen werden. Durch Nutzung der Website erklären Sie sich damit einverstanden. Weitere Informationen