Slimme en inclusieve spraakherkenning

Hoe spraakherkenning inclusief wordt ontwikkeld voor doven en slechthorenden door de inzet van onderzoekers van Gallaudet University (de enige universiteit voor doven ter wereld)

Goedemorgen,

Voor slechthorenden zijn veel toepassingen van artificial intelligence (AI) een zegen. Moderne hoortoestellen zijn bijvoorbeeld toegerust met AI, waardoor ze automatisch afstemmen op de geluidsomgeving. Zo kan jij in de meest uiteenlopende situaties gesprekken (beter) verstaan.

Spraakherkenning

Een andere AI-toepassing die enorme toegevoegde waarde heeft, is spraakherkenning. Hierdoor wordt spraak-naar-tekst steeds beter. Er is echter ook een risico. Spraakherkenning wordt namelijk ontwikkeld op basis van beschikbare datasets van stemmen. Stemmen die niet in deze datasets zitten, worden minder goed herkend.

En dat is een probleem voor mensen waarvan de stem afwijkt van het gemiddelde, bijvoorbeeld mensen die stotteren, mensen die een beroerte hebben gehad of mensen met cerebrale parese (CP). En voor mensen die (vanaf jonge leeftijd) doof of slechthorend zijn en daardoor anders spreken.

Dat leidt ertoe dat mensen worden uitgesloten. Denk bijvoorbeeld aan de onmogelijkheid om applicaties zoals Google Home te bedienen als spraak niet herkend wordt. Of aan notulen van vergaderingen op basis van automatische transcriptie, waarbij een stem letterlijk niet gehoord wordt.

Speech Accessibility Project

Gelukkig is er in Amerika een initiatief om spraakherkenning inclusief te maken. (Laat Trump&co het niet horen…) Het ‘Speech Accessibility Project’ van het Beckman Institute for Advanced Science and Technology. Zij maken datasets met opnamen van mensen waarvan de stem afwijkt van de standaard (deelnemers aan het onderzoeksproject), om daarmee spraakherkenningssystemen te trainen. Onderzoekers van het project werken samen met Amazon, Apple, Google, Meta en Microsoft. Gallaudet University, de universiteit voor doven, doet mee aan het project.

“Als we ervoor zorgen dat spraakherkenningssystemen de stemmen van dove en slechthorende gebruikers goed kunnen herkennen, zorgt dit voor minder stigma rond ‘niet standaard’-stemmen , zegt Raja Kushalnagar, de hoofdonderzoeker vanuit Gallaudet bij dit project. Het kan doven en slechthorenden helpen om volledig mee te kunnen doen in groepsgesprekken met horenden.

Hij benadrukt dat deze spraakherkenningssystemen ook gebruikt kunnen worden in combinatie met systemen voor de herkenning van gebarentaal, zodat er meer inclusieve platformen voor communicatie, onderwijs en media komen.

Zinnen voorlezen

Hoe gaat het Speech Accessibility Project in de praktijk? Het team van Gallaudet wil 400 dove en slechthorende deelnemers werven. Zij krijgen een vrijwilligersvergoeding en nemen spraakfragmenten op: ze lezen hardop honderden zinnen en beantwoorden een aantal vragen, zoals ‘Wat zijn je hobby’s?’. Die worden vervolgens gedeeld met de bedrijven om producten die spraakherkenning gebruiken te verbeteren.

Ik ben erg nieuwsgierig naar de resultaten van dit project, dat grote potentie heeft. Waarschijnlijk worden de datasets nu alleen aangevuld met Engelse/Amerikaanse stemmen, hopelijk krijgt het ook navolging in het Nederlands.

Fijne werkweek!

Stan

Bronnen

Reply

or to participate.