Fra Lyd til Tekst

Udsendelse d.11. -17. marts. 2023

Der kom to studerende forbi den2radio, de havde en historie om deres forskning i TALEGENKENDELSE. Den historie fik vi. Til gengæld havde den2radio noget de gerne ville have.
I videnskaben navn og med gode hensigter udveksler vi knaldhårde data, men før det kan foregå skal vi vide hvad de to forsker i.

Talegenkendelse til tekst er i første omgang en hjælp til hørehæmmede og ordblinde med oplæsning, teksten kan evt. gemmes og man kan slå op undervejs og se hvad der blev sagt. og den kan bruges til præcise referater og gengivelser af samtaler. 

Det er Emil Joensen og Anders Stendevad, der står bag forskningen i talegenkendelsen. De er specialestuderende i Data Science fra IT-Universitetet i København, og hører til den første årgang kandidater i dataservice og så kan de smykke sig med titlen cand. scient.

De lydfiler den2radio har liggende vil blive brugt til en ny model, der kan omdanne lyd til tekst. Ja, vil nogen sige, det er opfundet, men ikke godt nok og det nye er, at kunne hælde en bunke data ned i en datamodel som lynhurtigt danner lyden af sproget om til den helt rigtigt tekst og det gøres simultant og så kan det også gemmes på mobilen eller tabletten. At kunne gøre det, kræver meget varierede stemmer fra den lyse barnestemme til den dybe voksenstemme, forskellige emner og faglige sprogområder som modellen skal lære. Det er en læreproces for modellen, hvor lyde, sætninger og bogstaver klippes ud for så at skabe tekster der giver mening - en slags kryds og tværs - inden det hænger rigtigt sammen
De to unger forskere beskæftiger sig med al det der ligger bagved - altså før brugeren skal klikke på sin device. Det er alle de teknologiske data, som får det til at virke og let at bruge og det kræver machine learning og matematisk forståelse for at få enderne til at mødes.
Men lyt og få flere detaljer med.

Tilrettelæggelse Anne Eggen

Foto: Anne Eggen

 

MEDARBEJDER

Anne Eggen