Home Technologieën Spraakherkenningssoftware (ASR)

Spraakherkenningssoftware (ASR)

Wat is automatische spraakherkenning?

Spraakherkenning of Automatic Speech Recognition (ASR) is een technologie die spraak omzet in geschreven tekst.

Ubiqus maakt gebruik van een specifiek domein van ASR, namelijk LVCSR (Large Vocabulary Continuous Speech Recognition). Deze technologie, die gebaseerd is op de automatische identificatie van zeer korte audiosequenties, levert uitstekende transcripties op, maar alleen als de geluidsopname van goede kwaliteit is. ASR is de laatste jaren sterk geëvolueerd … en ons R&D-team draagt voortdurend bij aan de vooruitgang van deze technologie.

Onze spraakherkenningssoftware is geschikt voor opnames waarin zowel een algemene woordenschat als gespecialiseerde terminologie (technisch, juridisch, medisch, enz.) worden gebruikt.

Het proces bestaat uit 4 stappen:

1 | Spraakdetectie of Voice Activity Detection

Allereerst moet de software detecteren op welke momenten van de opname iemand aan het woord is, om zo het audiobestand in segmenten te knippen. Het softwareprogramma zal met elk van deze segmenten aan de slag gaan.

2 | Diarizatie

Vervolgens moeten de verschillende sprekers geïdentificeerd worden die in elk segment aan het woord zijn, om zo de segmenten van eenzelfde spreker te kunnen vergelijken en elk spraakfragment aan de juiste spreker toe te kunnen wijzen in de transcriptie. Hiervoor gebruikt de software verschillende motoren, die getraind werden aan de hand van een groot aantal gegevens (talen, stemmen). Op die manier kan het programma rekening houden met subtiele taalkenmerken, zoals accenten. In dit stadium gaat het nog steeds om een “mathematische” verwerking van de gegevens.

3 | Decoderen

Voor elk audiosegment wordt een lijst met mogelijke lettergrepen (fonemen) opgesteld. Op dit moment staat er nog geen enkele zin op papier: er is enkel een lange lijst van mogelijkheden, elk met een score.

4 | Rescoring

De computer kiest de meest waarschijnlijke zin uit alle fonemen en woorden die hij tijdens zijn initiële training heeft geleerd (een beetje zoals een gps het beste traject identificeert). Deze zin neemt hij over in de transcriptie.

 

Deze werkwijze wordt toegepast op alle geluidssegmenten om uiteindelijk de volledige transcriptie te genereren.

Na afloop van dit geautomatiseerde proces kan de transcriptie door onze teams worden nagelezen op de klassieke Ubiqus-manier: naast een inhoudelijke controle zorgt de revisor ook voor de opmaak.

Wilt u meer weten over onze vertaalinterfaces? Contacteer ons of neem een kijkje op onze pagina over API’s.

Ubiqus brengt mens en technologie dichter bij elkaar

U bent vertrouwd met de kwaliteit van Ubiqus en het lijkt u wel iets om automatische transcriptie te testen? Probeer het eens! Het kwaliteitsniveau van een automatische transcriptie blijft even hoog als dat van een klassieke transcriptie. Zodra de automatische transcriptie klaar is, wordt ze immers door een mens nagelezen!

De sectoren waarin
taaltechnologieën worden gebruikt

Ontdek de technologische taaloplossingen die van pas kunnen komen in uw sector.

Vertel ons over uw project

Tevreden klanten aan het woord