Home Technologieën Spraakherkenningssoftware (ASR)

Spraakherkenningssoftware (ASR)

Wat is automatische spraakherkenning?

Spraakherkenning of Automatic Speech Recognition (ASR) is een technologie die spraak omzet in geschreven tekst.

Ubiqus maakt gebruik van een specifiek domein van ASR, namelijk LVCSR (Large Vocabulary Continuous Speech Recognition). Deze technologie, die gebaseerd is op de automatische identificatie van zeer korte audiosequenties, levert uitstekende transcripties op, maar alleen als de geluidsopname van goede kwaliteit is. ASR is de laatste jaren sterk geëvolueerd … en ons R&D-team draagt voortdurend bij aan de vooruitgang van deze technologie.

Onze spraakherkenningssoftware is geschikt voor opnames waarin zowel een algemene woordenschat als gespecialiseerde terminologie (technisch, juridisch, medisch, enz.) worden gebruikt.

Het proces bestaat uit 4 stappen:

1 | Spraakdetectie of Voice Activity Detection

Allereerst moet de software detecteren op welke momenten van de opname iemand aan het woord is, om zo het audiobestand in segmenten te knippen. Het softwareprogramma zal met elk van deze segmenten aan de slag gaan.

2 | Diarizatie

Vervolgens moeten de verschillende sprekers geïdentificeerd worden die in elk segment aan het woord zijn, om zo de segmenten van eenzelfde spreker te kunnen vergelijken en elk spraakfragment aan de juiste spreker toe te kunnen wijzen in de transcriptie. Hiervoor gebruikt de software verschillende motoren, die getraind werden aan de hand van een groot aantal gegevens (talen, stemmen). Op die manier kan het programma rekening houden met subtiele taalkenmerken, zoals accenten. In dit stadium gaat het nog steeds om een “mathematische” verwerking van de gegevens.

3 | Decoderen

Voor elk audiosegment wordt een lijst met mogelijke lettergrepen (fonemen) opgesteld. Op dit moment staat er nog geen enkele zin op papier: er is enkel een lange lijst van mogelijkheden, elk met een score.

4 | Rescoring

De computer kiest de meest waarschijnlijke zin uit alle fonemen en woorden die hij tijdens zijn initiële training heeft geleerd (een beetje zoals een gps het beste traject identificeert). Deze zin neemt hij over in de transcriptie.

Deze werkwijze wordt toegepast op alle geluidssegmenten om uiteindelijk de volledige transcriptie te genereren.

Na afloop van dit geautomatiseerde proces kan de transcriptie door onze teams worden nagelezen op de klassieke Ubiqus-manier: naast een inhoudelijke controle zorgt de revisor ook voor de opmaak.

Wilt u meer weten over onze vertaalinterfaces? Contacteer ons of neem een kijkje op onze pagina over API’s.

Ubiqus brengt mens en technologie dichter bij elkaar

U bent vertrouwd met de kwaliteit van Ubiqus en het lijkt u wel iets om automatische transcriptie te testen? Probeer het eens! Het kwaliteitsniveau van een automatische transcriptie blijft even hoog als dat van een klassieke transcriptie. Zodra de automatische transcriptie klaar is, wordt ze immers door een mens nagelezen!

De sectoren waarin
taaltechnologieën worden gebruikt

Ontdek de technologische taaloplossingen die van pas kunnen komen in uw sector.

Financiële sector

Klassieke vertalingen
Online vertalingen
Verslagen en samenvattingen

LEES HIER MEER

Industriesector

Technische vertalingen
Adaptatie aan de normen van de sector
Verslagen en samenvattingen van vergaderingen

LEES HIER MEER

Juridische sector

Juridische vertalingen
Beëdigde vertalingen
Online juridische vertalingen

LEES HIER MEER

Medische sector

Gespecialiseerde vertalingen
Medische transcriptie
Online medische vertalingen

LEES HIER MEER

Publieke sector

Verslagen en samenvattingen van vergaderingen
Vertalingen
Tolkwerk

LEES HIER MEER

Hightech & media

Online vertalingen
Vertaal-API’s en connectoren
Lokalisatie van videocontent
Geoptimaliseerde websitevertalingen

LEES HIER MEER

Luxe-sector

Vertaling en transcreatie
Grafische vormgeving
Redactiesecretariaat

LEES HIER MEER

Lifestylesector

Ondertiteling van promotievideo's
Bewerking van verpakkingen
Vertalingen voor webshops

LEES HIER MEER

Vertel ons over uw project

Contact opnemen

Tevreden klanten aan het woord

Cookie	Duur	Beschrijving
_ga	2 years	Dit cookie wordt geïnstalleerd door Google Analytics. Het cookie wordt gebruikt om bezoekers-, sessie-, campagnegegevens te berekenen en het gebruik van de site bij te houden voor het analyserapport van de site. De cookies slaan anoniem informatie op en kennen een willekeurig gegenereerd nummer toe om unieke bezoekers te identificeren.
_gid	1 day	Dit cookie wordt geïnstalleerd door Google Analytics. Het cookie wordt gebruikt om informatie op te slaan over hoe bezoekers een website gebruiken en helpt om een analyserapport op te stellen over hoe het met de website gaat. De verzamelde gegevens, waaronder het aantal bezoekers, de bron waar ze vandaan komen en de pagina’s worden in anonieme vorm bekeken.

Spraakherkenningssoftware (ASR)

Wat is automatische spraakherkenning?

1 | Spraakdetectie of Voice Activity Detection

2 | Diarizatie

3 | Decoderen

4 | Rescoring

Ubiqus brengt mens en technologie dichter bij elkaar

De sectoren waarin taaltechnologieën worden gebruikt

Financiële sector

Industriesector

Juridische sector

Medische sector

Publieke sector

Hightech & media

Luxe-sector

Lifestylesector

De sectoren waarin
taaltechnologieën worden gebruikt