De logica achter factuurherkenning met OCR-software

Ellen Van Muylder - 26 september 2019

Met factuurherkenning OCR software: van pdf factuur naar UBL factuur

Als leverancier van een factuurherkenningsoplossing krijgen wij dikwijls de vraag van onze klanten wat de logica achter de herkenning is. Wat maakt dat een factuur goed herkend kan worden?

In een ideale situatie leveren de meeste leveranciers meteen vanuit hun facturatieprogramma een UBL aan naast de PDF-factuur. Zo kan die meteen digitaal verwerkt worden en zijn er geen extra handelingen meer nodig. Aangezien we nog niet zo ver zijn, is een goede factuurherkenning van groot belang.

 

Wat is nu juist factuurherkenning met OCR-software en hoe zit deze logica in elkaar?

 

Om een PDF factuur om te zetten naar UBL, wordt er gebruikt gemaakt van OCR-software. OCR, Optical Character Recognition of in het Nederlands optische tekenherkenning, staat voor een techniek waarbij uit een afbeelding of PDF, door middel van patroonherkenning, alle tekens worden uitgehaald.

Voor factuurherkenning wordt dus de lay-out van de PDF factuur gelezen en worden zo de gegevens daaruit omgezet naar tekst voor verdere verwerking naar een UBL. Het spreekt voor zich: hoe logischer de opbouw van de lay-out van deze factuur, hoe waardevoller de herkenning. En daar wringt nu net het schoentje. Er is geen rechtlijnigheid in hoe een factuur opgebouwd is.

 

De lay-out van de factuur heeft u zelf in de hand

 

Hier meteen de eerste logica: hoe kwalitatiever de opbouw en gegevens van de PDF-factuur, hoe waardevoller de factuurherkenning. Mits kleine aanpassingen aan de lay-out van de factuur, kan u er zelf voor zorgen dat er een hogere herkenning mogelijk is. Zo verloopt de automatische omzetting naar UBL vlotter en verminderen de manuele handelingen die nodig zijn voor verdere verwerking.

Kort gezegd, los de problemen op aan het begin van de ketting. Dit zorgt voor minder problemen en minder werk aan het einde van de ketting.

 

De logica achter factuurherkenning

 

We geven graag enkele feiten mee waarop factuurherkenning zich baseert. Zo kunnen kleine aanpassingen aan de lay-out van uw facturen een groot verschil maken.

 

Wat wordt  er meestal 100% herkend

Ondernemingsnummers van klanten en leveranciers en ook OGM-nummers worden meestal 100% herkend door de OCR-software. Dit omdat deze duidelijk controleerbare gegevens zijn met een checksum.

Kolom- en rijlogica

Gegevens worden aan elkaar gerelateerd in kolommen of rijen. Staat bijvoorbeeld het factuurnummer dus niet achter of onder de verwijzing “factuurnummer / documentnummer” dan is dit moeilijker of niet herkenbaar.

De effectieve afbakening van rij- en kolomgegevens met lijnen verbetert bovendien de herkenning ook nog.

BTW-percentage

Voor de BTW-voet gaat de factuurherkenning op zoek naar een bedrag waar een percentageteken achter staat. Het percentageteken er niet bij vermelden of voor het bedrag plaatsen, geeft een moeilijkere herkenning.

Indien er geen percentagetekens vermeld staan, stelt de software als standaard 21% voor omdat deze BTW-voet het meeste voorkomt. 

Ook is het van groot belang dat enkel het BTW-percentage vermeld staat dat effectief van toepassing is. We zien heel vaak dat de andere BTW-percentages eveneens vermeld staan, ook al zijn ze niet van toepassing. Vermeld enkel het BTW-percentage dat effectief berekend wordt. De andere laat u best achterwege. Zo kan de OCR software er met meer zekerheid het juiste BTW percentage uit herkennen.

Header-velden

Zet het header-veld steeds boven het gegeven. Staat deze eronder dan kan dit niet of moeilijker uitgelezen worden. In het voorbeeld hieronder is dit van toepassing op het ‘Te betalen’ veld.  Deze staat onder het dataveld en kan dus niet of moeilijk uitgelezen worden.

Ondernemingsnummer

Hoewel we hierboven reeds vermeld hebben dat een ondernemingsnummer steeds herkend kan worden, is het toch belangrijk dat deze heel duidelijk vermeld wordt op de factuur. Dikwijls staat deze ergens onderaan in de voetnoot of heel klein vermeld waardoor deze toch niet herkend kan worden. Vermeld steeds duidelijk en leesbaar uw ondernemingsnummer en dat van uw klant op de factuur. Doe dit op een normale tekstgrootte en op een duidelijke plaats. Eventueel kan deze mee opgenomen worden bovenaan bij het logo of de factuurgegevens.

 

Algemeen

We geven graag nog een paar kleine weetjes mee waar ook gemakkelijk rekening mee gehouden kan worden in de lay-out van de PDF factuur.

  1. Beperk het gebruik van kleuren. Deze vormen mogelijks problemen voor een goede herkenning. Gebruikt u toch kleur, hou dan zeker rekening met de contrasten. Indien er tussen de kleuren, zelfs bij grijstinten, onvoldoende contrasten zijn, bemoeilijkt dit het uitlezen. De kleurencombinatie zwart-wit blijft de beste optie voor factuurherkenning.
  2. Werk met de klassieke lettertypes of de ‘sans-serif’ lettertypes (schreefloos).  Zonder te veel krullen of streepjes aan de letter heeft het letterbeeld een grotere variatievorm. Hierdoor zijn de letters makkelijker te onderscheiden en dus herkenbaarder.
  3. Hou uw lay-out best simpel. Als uw geleverd product of dienst in orde was, zal de betaling van de factuur wel volgen. Een digitaal goed herkende factuur zorgt namelijk ook voor een snellere betaling.
  4. Zet alle headergegevens duidelijk op de factuur met de juiste benaming in de buurt: Factuurdatum: 17/6/19             Factuurnummer: 2019095      Vermijd eveneens spaties in factuurnummers. Schrijf niet: 2019 / 095  maar wel: 2019/095 Baken ook OGM-nummers correct af. Dit betekent : +++123/1234/12345+++ of ***123/1234/12345*** Anders worden ze moeilijker of niet herkend.
  5. Laat de tekst niet door kolomlijnen lopen of zet ze niet te dicht tegen een kaderlijn. Dit bemoeilijkt de leesbaarheid en dus ook de factuurherkenning.
  6. En last but not least: laat uw klant een digitaal ontvangen factuur digitaal doorsturen. Zo heeft u geen kwaliteitsverlies door printen en opnieuw scannen. Slechte scans zijn namelijk heel dikwijls de oorzaak van een slechte herkenning.

 

In afwachting van de ideale situatie waarbij elke PDF-factuur gekoppeld is aan een UBL-factuur, is herkenningssoftware een goed, tijdelijk alternatief om uw tijd te doen besparen.

Maar maak het uzelf hierin gemakkelijk. Verhoog het percentage van factuurherkenning door deze kleine en eenvoudige aanpassingen door te voeren in de lay-out van uw eigen facturen of door deze tips mee te geven aan uw klanten en leveranciers. Dit is een kleine moeite die de kwaliteit van de automatische factuurherkenning onmiddellijk verhoogt. Hierdoor verminderen uw manuele handelingen aanzienlijk en bijgevolg verhoogt uw productiviteit.

Voor de rest laat u het maar aan COMAX over. Wij zorgen ervoor dat er van elke factuur automatisch een UBL-bestand gecreëerd wordt dat in elk boekhoudpakket ingelezen kan worden.

 

Contacteer ons gerust voor bijkomende vragen of advies via www.comax.be

 

Ellen Van Muylder

Ellen inschakelen voor je zaak?