Home Technologieën Spraakherkenningssoftware (ASR)
Spraakherkenningssoftware (ASR)
Wat is automatische spraakherkenning?
Spraakherkenning of Automatic Speech Recognition (ASR) is een technologie die spraak omzet in geschreven tekst.
Ubiqus maakt gebruik van een specifiek domein van ASR, namelijk LVCSR (Large Vocabulary Continuous Speech Recognition). Deze technologie, die gebaseerd is op de automatische identificatie van zeer korte audiosequenties, levert uitstekende transcripties op, maar alleen als de geluidsopname van goede kwaliteit is. ASR is de laatste jaren sterk geëvolueerd … en ons R&D-team draagt voortdurend bij aan de vooruitgang van deze technologie.
Onze spraakherkenningssoftware is geschikt voor opnames waarin zowel een algemene woordenschat als gespecialiseerde terminologie (technisch, juridisch, medisch, enz.) worden gebruikt.
Het proces bestaat uit 4 stappen:
1 | Spraakdetectie of Voice Activity Detection
Allereerst moet de software detecteren op welke momenten van de opname iemand aan het woord is, om zo het audiobestand in segmenten te knippen. Het softwareprogramma zal met elk van deze segmenten aan de slag gaan.
2 | Diarizatie
Vervolgens moeten de verschillende sprekers geïdentificeerd worden die in elk segment aan het woord zijn, om zo de segmenten van eenzelfde spreker te kunnen vergelijken en elk spraakfragment aan de juiste spreker toe te kunnen wijzen in de transcriptie. Hiervoor gebruikt de software verschillende motoren, die getraind werden aan de hand van een groot aantal gegevens (talen, stemmen). Op die manier kan het programma rekening houden met subtiele taalkenmerken, zoals accenten. In dit stadium gaat het nog steeds om een “mathematische” verwerking van de gegevens.
3 | Decoderen
Voor elk audiosegment wordt een lijst met mogelijke lettergrepen (fonemen) opgesteld. Op dit moment staat er nog geen enkele zin op papier: er is enkel een lange lijst van mogelijkheden, elk met een score.
4 | Rescoring
De computer kiest de meest waarschijnlijke zin uit alle fonemen en woorden die hij tijdens zijn initiële training heeft geleerd (een beetje zoals een gps het beste traject identificeert). Deze zin neemt hij over in de transcriptie.
Deze werkwijze wordt toegepast op alle geluidssegmenten om uiteindelijk de volledige transcriptie te genereren.
Na afloop van dit geautomatiseerde proces kan de transcriptie door onze teams worden nagelezen op de klassieke Ubiqus-manier: naast een inhoudelijke controle zorgt de revisor ook voor de opmaak.
Ubiqus brengt mens en technologie dichter bij elkaar
De sectoren waarin
taaltechnologieën worden gebruikt
Ontdek de technologische taaloplossingen die van pas kunnen komen in uw sector.
Financiële sector
Online vertalingen
Verslagen en samenvattingen
Industriesector
Adaptatie aan de normen van de sector
Verslagen en samenvattingen van vergaderingen
Juridische sector
Beëdigde vertalingen
Online juridische vertalingen
Medische sector
Medische transcriptie
Online medische vertalingen
Publieke sector
Vertalingen
Tolkwerk
Hightech & media
Vertaal-API’s en connectoren
Lokalisatie van videocontent
Geoptimaliseerde websitevertalingen
Luxe-sector
Grafische vormgeving
Redactiesecretariaat
Lifestylesector
Bewerking van verpakkingen
Vertalingen voor webshops
Vertel ons over uw project
Tevreden klanten aan het woord