Common Voice – größter öffentlicher Sprachdatensatz

Das Non-Profit-Unternehmen Mozilla entwickelt eine Open-Source-Plattform, um sprachgesteuerte Technologien in jeder lebendigen Sprache möglich zu machen. Dies könnte insbesondere Menschen, die nicht lesen oder schreiben können in Zukunft das Leben erleichtern.

Weitersagen

Common Voice – größter öffentlicher Sprachdatensatz

Heute können viele neue Technologien ganz einfach mit der eigenen Stimme gesteuert werden, ob Smartphone, die Beleuchtung der Wohnung oder sogar Autos. Allerdings sprechen diese Sprachassistenten nicht alle Sprachen der Welt. Weder Apples Sprachassistentin Siri noch Amazons Alexa beherrschen auch nur eine afrikanische Sprache.  

Common Voice als Alternative  

Mozilla ist ein Non-Profit-Unternehmen, das unter anderem den Webbrowser Firefox entwickelte. Im Juni 2017 ging dann die freie Datenbank für Spracherkennungs-Software “Common Voice” online. Die Open-Source-Initiative “Common Voice” gab im Mai 2021 bekannt, dass nun an einem Datensatz zur Sprache Swahili, die unter anderem in Ruanda, Kenia und Tansania gesprochen wird, gearbeitet werden soll. Finanziell unterstützt wird dieses Vorhaben von der deutschen und britischen Regierung und der Bill und Melinda Gates Stiftung. 

Sprachsteuerung diversifizieren 

Common Voice wurde allerdings nicht exklusiv für afrikanische Sprachen entwickelt, vielmehr setzten sich die Entwicklerinnen und Entwickler zum Ziel eine Open-Source-Plattform aufzubauen, die die Grundlagen für sprachgesteuerte Technologien in allen 7.100 “lebendigen Sprachen” legt. Bei lebendigen Sprachen handelt es sich um Sprachen, die heute von einer Sprachgemeinschaft verwendet werden. 

Bis heute wurden 9.000 Stunden Sprachaufnahmen von 160.000 Menschen in 60 verschiedenen Sprachen eingereicht. Für sprachgesteuerte Technologien werden riesige Datenmengen benötigt. Große Unternehmen nutzen dabei Daten, die der Allgemeinheit nicht zugänglich sind. Mozilla möchte mit Common Voice freizugängliche Datensätze schaffen, mit denen jeder und jede eigene Programme entwickeln kann – und das in jeder Sprache. 

Die Common VoicePlattform ist einfach zu bedienen: Auf der Webseite kann man direkt beginnen seine eigene Stimme aufzunehmen und etwas beizutragen. Praktisch sollen fünf verschiedene Sätze vorgelesen und aufgenommen werden. Diese Sätze werden dann in einem nächsten Schritt von mindestens zwei anderen Menschen angehört, diese müssen dann bestätigen, dass sie richtig vorgelesen wurden. Auch diese Aufgabe kann auf der Webseite übernommen werden.  

Nach Hackathon wird Chatbot Mbaza entwickelt 

12 Millionen Menschen in Ruanda sprechen die Sprache Kinyarwanda. Nach einem Hackathon, den Common Voice in der Hauptstadt Kigali veranstaltete, ist Kinyarwanda nun eine der schnellst wachsenden Sprachen der Plattform.Bisher wurden 1.700 Stunden Sprachaufnahmen eingeschickt. 

Infolge des Hackathons entstand das Startup “Digital Umuganda”, welches sich auf Lösungen mit Hilfe von künstlicher Intelligenz spezialisierte. Umugunda bedeutet “Gemeinschaft” und “Kooperation” in Kinyarwanda.  

Digital Umuganda entwickelte den Chatbot Mbaza mit Hilfe des Datensatzes von Common Voice. Mbaza eröffnet Menschen, die nicht lesen oder schreiben können, einen einfacheren Weg mit lokalen Behörden und Regierungen Kontakt aufzunehmen und zu kommunizieren. Beispielsweise durch Spracherkennung, somit können auch Menschen, die nicht schreiben können, Briefe verfassen oder Informationen aus öffentlichen Dokumenten ziehen. Die Kommunikation mit Behörden oder Banken könnte dadurch für Analphabetinnen und Analphabeten erleichtert werden. Dadurch könnten sie ihr Leben auch unabhängiger von anderen führen.  

Sprachsteuerung für alle 

Nun soll Common Voice in Afrika expandieren, begonnen werden soll mit ostafrikanischen Sprachen. Da Common Voice auf die Sprachspenden seiner Community angewiesen ist, wird derzeit der nächste Schritt sein diese Community zu vergrößern.  

Wie wichtig Sprache ist und welche innovativen Lösungen für Verständigungs- und Repräsentationsschwierigkeiten schon entwickelt wurden, könnt ihr in diesen Artikeln nachlesen:  

Student entwickelt Übersetzungssoftware für die Sprache „Fon” 

Afrikanische Schülerinnen und Schüler schreiben Wikipedia-Artikel über ihren Heimatkontinent 

Quelle:  

Baumann, F. / NVIDIA investiert 1,5 Millionen Dollar in Mozillas Common Voice-Projekt in mobile geeks am 16.04.2021. 

Corbley, A. / Siri and Alexa Don’t Support African Languages But This Nonprofit Swooped in to Offer 60 New Voices – Including Welsh im Good News Network vom 09.06.2021 

Datum: 25.06.2021