Frei verfügbar

Gewaltiger Datensatz menschlicher Stimmen im Web

Digital
28.02.2019 16:13

Mozilla, der Hersteller des Firefox-Browsers, hat den größten Datensatz menschlicher Stimmen verfügbar gemacht, der komplett von Freiwilligen eingesprochen wurde. Mit dem Projekt „Common Voice“ soll der weltweit vielfältigste Sprachdatensatz erstellt werden, der für die Entwicklung von Sprachtechnologien optimiert ist.

Das Unternehmen in San Francisco will damit vor allem kleineren Herstellern und Crowdfunding-Projekten ohne Lizenzgebühren ermöglichen, eigene Spracherkennungssysteme zu entwickeln. Bisher dominieren die großen Internetkonzerne wie Google, Microsoft, IBM, Amazon und Apple den Markt für Spracherkennung. Wichtiger Player ist außerdem das Unternehmen Nuance, dessen Technik hinter der Spracherkennung von Apples Siri steckt.

1400 Stunden Audio von 42.000 Menschen in 18 Sprachen
Der Datensatz von Mozilla umfasst nach Angaben des Unternehmens 18 verschiedene Sprachen, darunter Englisch, Französisch, Deutsch und Mandarin (traditionell), aber auch beispielsweise Walisisch und Kabyle, eine algerische Berbersprache. Der Datensatz summiert sich zu fast 1400 Stunden aufgezeichneter Sprachdaten von mehr als 42.000 Mitwirkenden.

Dank Creative Commons für jedermann verfügbar
Die von Mozilla eingesammelten Daten stehen unter der „CC0“-Lizenz zur Verfügung. Das ist die freizügigste Variante der Creative-Commons-Lizenzen („No rights reserved“). Die Projekt-Teilnehmer haben dabei freiwillig auch Metadaten wie Alter, Geschlecht und Akzent angeben.

„Damit werden gemeinsam mit ihren Aufzeichnungen weitere Informationen gespeichert, mit denen Sprach-Engines noch besser trainiert werden können“, heißt es in dem Blog-Eintrag von Mozilla. Man wolle „zu einem vielfältigen und innovativen Ökosystem an Sprachtechnologien“ beitragen. Ziel sei es, eigene sprachgesteuerte Produkte auf den Markt zu bringen, aber auch Forscher und kleinere Akteure zu unterstützen.

 krone.at
krone.at
Loading...
00:00 / 00:00
play_arrow
close
expand_more
Loading...
replay_10
skip_previous
play_arrow
skip_next
forward_10
00:00
00:00
1.0x Geschwindigkeit
explore
Neue "Stories" entdecken
Beta
Loading
Kommentare

Da dieser Artikel älter als 18 Monate ist, ist zum jetzigen Zeitpunkt kein Kommentieren mehr möglich.

Wir laden Sie ein, bei einer aktuelleren themenrelevanten Story mitzudiskutieren: Themenübersicht.

Bei Fragen können Sie sich gern an das Community-Team per Mail an forum@krone.at wenden.

(Bild: krone.at)
(Bild: krone.at)
Kreuzworträtsel (Bild: krone.at)
(Bild: krone.at)



Kostenlose Spiele