Wat Is Fuzzy Matching?

Fuzzy matching is een methode die wordt gebruikt in sommige computerprogramma's, met name die bedoeld zijn om de tekst automatisch tussen verschillende talen te vertalen. Het werkt in situaties waarin de database die door de software hoeft niet een exacte match voor een stuk tekst. In plaats daarvan, de database zoekt nauwe wedstrijden, met menselijke revisie meestal te controleren of deze wedstrijd is acceptabel nauwkeurig.

De meeste geautomatiseerde vertaalprogramma's gewoon tekst te vergelijken met een database van eerdere vertalingen. Deze database wordt meestal bekend als een vertaalgeheugen (TM). Elke nieuwe en bevestigd vertaling wordt toegevoegd aan de database, waardoor toekomstige vertalingen meestal nauwkeuriger en sneller.

Normaal gesproken, TM-gebaseerde vertaling werkt met hele zinnen. Bijvoorbeeld, als een gebruiker eerder heeft ingestemd met een bepaalde zin in het Frans als een nauwkeurige vertaling van: "De winkel is open 09:00-05:00 op weekdagen, maar sluit om 02:00 op woensdag," dan is de volgende keer dat de software wordt gevraagd om die zin te vertalen, zal het automatisch hetzelfde Franse formulering te gebruiken als voorheen.

De fuzzy matching tool werkt met situaties waarin een bepaalde zin niet is gekomen tot in de documenten vertaald door het systeem voor. De tool gaat ofwel de maker van de software of de eindgebruiker het vaststellen van een aanvaardbaar fuzzy matching niveau in de vorm van een percentage wedstrijd. Als de frase is dicht genoeg bij een eerder vertaalde dit percentage match voldoen, zal de software de gebruiker van de wedstrijd te adviseren, geven de voorgaande vertaling, en vraag de gebruiker om te bevestigen of te bewerken de voorgestelde vertaling.

Follow-up van het vorige voorbeeld, als de fuzzy matching drempel werd vastgesteld op 90% en de nieuwe Engels document bevatte de zin, "De winkel opent 09:00-05:00 op weekdagen, maar sluit om 14:00 op woensdag," de software zou het eerder gebruikte vertaling suggereren en de gebruiker zou waarschijnlijk klikken om deze goed te keuren. Als het nieuwe document had de zin: "De winkel is open 09:00-17:00 op weekdagen, maar sluit om 14:00 op donderdag," de software zou het eerder gebruikte vertaling suggereren en de gebruiker zou deze vertaling afsluiten met het corrigeren Franse woord voor donderdag. Als het nieuwe document had de zin: "De winkel is open 09:00-05:00 op elke doordeweekse dag, behalve op woensdag, toen het sluit om 02:00," de software zou dit niet een fuzzy match overwegen, ondanks de betekenis is hetzelfde, en dus zou een automatische vertaling van de zin niet te bieden, zodat de gebruiker om het handmatig te vertalen.