september 29, 2020

AI heeft baat bij ongestructureerde data

AI heeft baat bij ongestructureerde data

Artificial Intelligence-technieken als machine learning en deep learning veranderen de manier waarop we werken, studeren en consumeren. Veel bedrijven realiseren zich dat en willen ermee aan de slag. Maar ze kampen met een gebrek aan gekwalificeerd personeel of resources, zo blijkt uit onderzoek.

Dankzij de cloud is rekenkracht niet langer de beperkende factor

Ongestructureerde data steeds vaker bruikbaar voor machine learning

De stroomversnelling waarin AI is geraakt komt niet zomaar uit de lucht vallen. Bedrijven genereren tegenwoordig een ongelofelijke hoeveelheid data. Interacties met klanten, partners en opdrachtgevers zijn steeds vaker digitaal. Daarnaast vindt een groot deel van de dienstverlening online plaats. Deze interacties leveren gestructureerde data op die goed gebruikt kan worden voor het trainen van AI-systemen.

Maar dit is niet de enige data die gebruikt wordt. Ook ongestructureerde data die tot voor kort niet bruikbaar leek, zoals papieren archieven, Office-documenten en afbeeldingen, zijn na analyse en digitalisering te doorzoeken en gebruiken. Dit is een belangrijke doorbraak, want uit onderzoek van 451 Research in opdracht van Iron Mountain blijkt dat tegen 2025 ruim 80 procent van de data bestaat uit de ongestructureerde variant. Deze doorbraak zorgt voor een enorme toename aan databronnen waardoor de machine learning algoritmes nog beter hun taak kunnen uitvoeren.

Lees ook de whitepaper: Unlocking the Business Value of Unstructured Data with AI/ML

Naast de hoeveelheid benodigde data, was tot voor kort ook de benodigde rekenkracht een struikelblok. De razendsnelle ontwikkeling van cloud-computing maakt de rekenkracht die nodig is om deze data te analyseren bereikbaar voor een grote groep bedrijven, zonder dat daar enorme investeringen in hardware tegenover staan.

Artificial Intelligence voor het automatiseren van repeterende werkzaamheden

Al deze data en rekenkracht maakt het mogelijk om repeterende werkzaamheden te automatiseren. Denk bijvoorbeeld aan de slimme printers van tegenwoordig die zelf nieuwe inkt bestellen als ze leegraken. Machine learning kan daarnaast worden ingezet om documentatie te identificeren, classificeren en sorteren zonder dat daar nog mensenhanden aan te pas komen.

Machine learning gebruikt voor dit soort analyses enorme hoeveelheden data. Hoe meer bruikbare data aan het systeem wordt toegevoegd, hoe beter de resultaten worden. Daarmee kan het systeem bijvoorbeeld patronen ontdekken en aan de hand daarvan voorspellingen doen.

Zo berekenden onderzoekers van de Universiteit Utrecht met behulp van machine learning en deep learning hoe de plaatsing van tribunes en hekken van invloed waren op de enorme bezoekersstromen tijdens de start van de Tour de France in de stad. Na het evenement zijn de camerabeelden gebruikt om de daadwerkelijke bezoekersstromen als data toe te voegen en daarmee nog betere voorspellingen mogelijk te maken.

Machine learning creëert structuur en herkent patronen

Een andere mogelijkheid met deze machine learning-algoritmen is het creëren van structuur. Zo kunnen gegevens van individuele klanten worden verzameld en geanalyseerd om gedrag en interesses te voorspellen die klanten niet hebben doorgegeven. Denk daarbij bijvoorbeeld aan een machine learning-algoritme dat na genoeg training in staat is om aan de hand van de zoektermen van klanten aan te geven of de klant met een negatief of positief sentiment aan het zoeken is.

Gebrek aan personeel zorgt een beperking van de mogelijkheden

Mogelijkheden te over met de inzet van deze AI-technieken. Dus waarom niet meteen aan de slag? Uit het onderzoek van 451 Research blijkt dat bedrijven wel willen, maar vooral kampen met een gebrek aan gespecialiseerd personeel. Developers en onderzoekers die de systemen kunnen bouwen, trainen en de resultaten kunnen analyseren zijn schaars. Veel bedrijven richten zich daarom op de aanschaf van software met ingebouwde machine learning-mogelijkheden, zodat ze zich er zelf niet mee bezig hoeven te houden. Dit kan goed uitpakken als je resultaten wilt op een bepaald gebied. Maar het is wel heel erg beperkt in zijn functionaliteit en je laat er de veel mogelijkheden mee onbenut.

Je wilt dus iets doen met die enorme hoeveelheid en tegelijk enorm waardevolle (ongestructureerde) data binnen je bedrijf en dus sta je voor de uitdaging deze nog onbenutte goudmijn op een juiste wijze te ontginnen. Bedenk daarbij dat het digitaliseren van de content niet genoeg is. De informatie moet namelijk ook vindbaar, beschikbaar en begrijpelijk worden gemaakt. Maar bedenk ook dat het zeker de moeite waard is om hierin te investeren. Alleen moet je wel een AI-model nemen dat je kunt inrichten voor je gehele business.