artikel

Data transformeren tot waardevolle informatie

Algemeen

In de levensmiddelenindustrie worden veel data gegenereerd waar vervolgens niets mee wordt gedaan. Er bestaan software technieken, inductieve technieken, die in staat zijn patronen in data om te zetten in bruikbare kennis. Het proefschrift van Floor Verdenius biedt een model voor het keuzeproces van de juiste inductieve technieken. Dat kan leiden tot betere beslissingen, betere producten en een betere procesvoering.

Hoe kun je inductieve technieken op een zodanige manier toepassen dat ze leiden tot een goed resultaat? Op een zodanige manier dat het systeem slim in elkaar zit en dat je ook nog kunt uitleggen waarom je het zo doet? Floor Verdenius heeft hiervoor een model opgezet. Zijn werk leidde tot een promotie aan de Universiteit van Amsterdam. Verdenius, in het dagelijks leven senior onderzoeker tracking & tracing research bij A&F, legt uit waar het om gaat: “Er bestaan veel verschillende inductieve technieken die kunnen worden toegepast in zelflerende systemen. Elke techniek heeft uiteraard zijn kwaliteiten en beperkingen. In het verleden werd bij een bepaalde vraag, bijvoorbeeld het maken van een complex planningsysteem, de keuze voor een van deze technieken vaak op basis van louter technische overwegingen gemaakt. De gekozen techniek was dan niet altijd even geschikt voor de gewenste toepassing. De techniek was weliswaar geavanceerd, maar het keuzeproces niet. Daardoor was de ontwikkelde oplossing vaak niet optimaal. Het was ook moeilijk om rationeel een goede techniek te kiezen want de betrokken mensen hadden vaak te weinig kennis over toepassingsmogelijkheden. Het benodigde theoretische inzicht om dit probleem aan te pakken was er nog niet. Ik heb een gestructureerd model ontwikkeld voor het ontwerp- en ontwikkeltraject voor inductieve systemen.”

Inductieve technieken
Inductieve technieken zijn technieken die zelf kennis afleiden uit gegevens. Verdenius: “Mensen kunnen dat ook goed. Een simpel voorbeeld: als je rijpe en onrijpe bananen moet scheiden, kun je dit vrij snel zelfstandig doen. Is bijvoorbeeld een banaan geel, zacht met bolle zijkanten, dan weet je dat hij in de categorie ‘rijp’ hoort. Groene, harde bananen met platte zijkanten horen in de categorie ‘onrijp’. Als je dit hebt ontdekt, kun je ook een nieuwe vrucht zonder toelichting indelen in de goede categorie. En je kunt ook aangeven waarom. Dat is inductief leren, leren aan de hand van voorbeelden.”

Sommige inductieve technieken leveren modellen op die inzichtelijk zijn voor mensen. Beslisbomen bijvoorbeeld vormen een cognitief, hiërarchisch systeem. Beslispunten worden daarin zo gerangschikt dat de belangrijkste criteria eerst aan bod komen. “Terugkomend op het voorbeeld: je bepaalt eerst of de banaan groen is. Als hij groen is, kijk je of hij ook hard aanvoelt. Zo ja, dan beoordeel je of de zijkanten vlak zijn. Als de banaan aan alledrie de criteria voldoet, is hij onrijp”, aldus Verdenius.

Er bestaan ook inductieve technieken die minder inzichtelijke technieken opleveren. Een voorbeeld van zo’n techniek is een neuraal netwerk. Deze techniek simuleert neurale processen zoals die zich in de hersenen afspelen. Die modellen werken, op een primitief niveau, op een vergelijkbare manier als menselijke hersens. Het resulterende model is minder toegankelijk voor mensen.
Verdenius richt zich in zijn proefschrift op hoe inductieve technieken toe te passen voor het oplossen van praktijkproblemen: ”Het gaat mij meer om de functionele kenmerken dan om de herkomstdiscipline.”

Welke techniek voor welke toepassing?
Belangrijk bij de aanpak van Verdenius is dat de toepassing het uitgangspunt vormt. “In de traditionele toepassingen domineerde de techniek. Bij mijn aanpak ga ik uit van de toepassing. Daartoe verdeel ik eerst het hele proces, bijvoorbeeld het bepalen van de meest geschikte manier om fruit te laten rijpen, in stappen. Vervolgens kijk ik per stap welke functie ik wil realiseren. De beschikbare kennis en data kan ik dan op een slimme manier inzetten om die bepaalde functie te realiseren. Pas daarna kan ik gefundeerd een techniek selecteren. De belangrijkste argumenten bij de selectie zijn de te verwachten ontwikkelkosten en de te verwachten kwaliteit die de techniek biedt voor die bepaalde functie. Door voor elke stap deze procedure te herhalen, krijg je uiteindelijk een systeem met per stap een andere techniek. Het totale systeem werkt optimaal.’

In het voorbeeld van de fruitrijping is de eerste stap het doen van een aantal metingen (door een expert) aan een beperkt aantal producten van de partij. De resultaten van de metingen zeggen iets over de hele batch. Deze resultaten worden vervolgens ingevoerd in een module die de hoofdlijnen van het ‘rijpingsrecept’ bepaalt. Uiteindelijk wordt op basis van een specificatie van de gewenste producten een specifiek recept gemaakt. Daarbij wordt gebruik gemaakt van expertkennis die in de software is geïntegreerd.”

De selectiestap van de techniek zelf is een technisch verhaal. Verdenius vat samen: “Ik heb een aanpak gevonden die objectief kan zeggen of een bepaalde techniek geschikt is voor een bepaalde toepassing. En ik kan bewijzen dat deze selectie beter is dan bij een andere aanpak.”

Industrie
Verdenius ziet tal van toepassingsmogelijkheden voor inductieve technieken in de voedingsmiddelenindustrie: “Overal waar veel data worden gegenereerd en waar weinig of incomplete kennis is. Dat kan zijn in de procesbesturing, in de logistiek, bij fraudebestrijding. Zo worden veel procesgegevens gegenereerd, terwijl het gros van die informatie niet wordt gebruikt voor het nemen van slimmere beslissingen. De vele data van grondstoffen, halffabrikaten en eindproducten worden in de meeste gevallen alleen geraadpleegd bij een incident. Alle gegevens uit de keten, tot en met point-of-sale in de retail, kunnen routinematig worden gebruikt. Het belangrijkste is dat mensen bereid zijn om over voordelen van nieuwe toepassingen na te denken. ‘We doen het al heel lang zo en het gaat toch goed’ is een veelgehoorde opmerking.”

Inductieve technieken worden nu al toegepast bij vision-systemen voor de classificatie van vlees, pluimvee en eieren en voor het modelleren van productkenmerken in de AGF-sector. In de verwerkende industrie bieden inductieve technieken de productontwikkelaar nieuwe mogelijkheden. “Nu worden veel dingen geprobeerd via trial and error. Met inductieve technieken kun je veel gerichter ontwikkelen.”

Ook bij early warning-systemen in de keten en bij fraudebestrijding ziet Verdenius mogelijkheden: “Als je vooraan in de keten al weet dat een bepaalde grondstof niet geschikt is voor alle toepassingen, kun je in een vroeg stadium je ketenpartners waarschuwen. Die kunnen dan betere beslissingen nemen. Uiteindelijk levert dit besparingen op. Fraude kun je makkelijker detecteren door de resultaten van analytische metingen van producten te gaan verwerken. Je krijgt dan complexe profielen van analytische data voor bijvoorbeeld wijnen uit Bordeaux, olijfolie van de eerste persing of drie keer gedestilleerde whisky. Als je twijfelt aan de claims van bepaalde producten, kun je de analyseresultaten gaan vergelijken en zo eventuele fraude opsporen.”

Winst
Wat levert een beter gebruik van inductieve technieken op? “In algemene termen kun je zeggen: betere beslissingen, betere producten en een betere procesvoering”, aldus Verdenius. “Belangrijk om te weten is dat het model rekening houdt met de kwaliteitswinst die wordt gemaakt en met de ontwikkelkosten van het systeem. Dat betekent dat vooraf wordt bekeken of het economisch verantwoord is om een systeem te ontwikkelen.”

Verdenius geeft aan dat vooral bedrijven met eigen statistische expertise en software-ontwikkelcapaciteit zelf aan de slag kunnen met deze materie. Kleinere bedrijven kunnen hun vragen voorleggen aan aanbieders van data-analysesystemen of bij de promovendus zelf.

Reageer op dit artikel