I’ve put together a little demo of the Speech API from Azure Cognitive Services. I’m surprised at how well it understood my Norwegian!
The repo can be found on GitHub.
Example
Input
I read the first couple of paragraphs from this Aftenposten article:
Søndag kveld hadde 19 nordmenn testet positivt for koronaviruset.
Kanskje ville viruset funnet veien til Norge uansett. Men at Oslo universitetssykehus skulle bidra så til de grader til spredning av det, er nærmest utilgivelig.
Result
Recognized: Søndag kveld hadde 19 nordmenn testet positivt for kolonna viruset
Recognized: kanskje ville videre seg funnet veien til norge uansett
Recognized: men at oslo universitetssykehus skulle bidra så til de grader til spredning av det er nærmest utilgivelig
Recognized: stopp
It’s a very small dataset, but the calculated Word Error Rate (WER) in this example appears to be only 8.5%, which is pretty good!
S | 2 |
D | 0 |
I | 1 |
C | 33 |
N | 35 |
WER | 3/35% = 8.5% |