~1 min read

Categories

  • azure
  • cognitive
  • speech

I’ve put together a little demo of the Speech API from Azure Cognitive Services. I’m surprised at how well it understood my Norwegian!

The repo can be found on GitHub.

Example

Input

I read the first couple of paragraphs from this Aftenposten article:

Søndag kveld hadde 19 nordmenn testet positivt for koronaviruset.

Kanskje ville viruset funnet veien til Norge uansett. Men at Oslo universitetssykehus skulle bidra så til de grader til spredning av det, er nærmest utilgivelig.

Result

Recognized: Søndag kveld hadde 19 nordmenn testet positivt for kolonna viruset
Recognized: kanskje ville videre seg funnet veien til norge uansett
Recognized: men at oslo universitetssykehus skulle bidra så til de grader til spredning av det er nærmest utilgivelig
Recognized: stopp

It’s a very small dataset, but the calculated Word Error Rate (WER) in this example appears to be only 8.5%, which is pretty good!

   
S 2
D 0
I 1
C 33
N 35
WER 3/35% = 8.5%