Machine Learning en wat kan ik ermee?

Wat is machine learning?

Machine Learning een algemene benaming voor algoritmes die zichzelf door ervaring verbeteren. Klinkt als technologie die buiten je bereik valt? Wij denken van niet! De ambitie van onze Data Science specialisten is om jou effectief op weg te helpen met de toepassing van deze techniek.

Waarom we enthousiast zijn over Machine Learning

Die reden is simpel, onze oplossingen worden steeds beter zonder dat we daar een actieve bijdrage in leveren. Hoe mooi is dat? Stel, je ziet een verbetering van een terugkomende fout en deze fout hersteld zichzelf. Dat is je voordeel van deze moderne techniek, de resultaten worden steeds beter zonder dat je daarvoor speciaal moet programmeren.  Ook hoef je niet (meer) de fouten expliciet aan een externe programmeur uit te leggen. Via dit proces wordt je werkproces steeds efficiënter!

Machine Learning en resultaat

Hoe werkt Machine Learning?

Dat is altijd spannend bij het opzetten van de Machine Learning architectuur. Geeft de exportdata aan de hand van de getrainde dataset het gewenste resultaat? Geen zorgen de kennis om tot een goed resultaat te komen is bij EasyData ruimschoots voorhanden. Het samenstellen van een Machine Learning netwerk dat specifiek is ontwikkeld voor jouw opdracht is een specialisme dat we beheersen. En meer dan dat, dit is kennis die we graag met onze klanten delen!

Ik wil eigenlijk snel resultaat…

Dat kan, vaak zijn we in staat snel resultaten te presenteren. Hiervoor werken met onze eigen krachtige servers in ons eigen beveiligde Datacenter. De algoritmen voor jouw toepassingen hoeven ook niet van de grond af aan opgebouwd te worden. EasyData werkt veelal met onze eigen bestaande technologie. Met al deze kennis en expertise ‘aan boord’ zijn we zodoende in staat om in relatief korte tijd een omgeving voor jouw specifieke Machine Learning opdracht te configureren. Meer weten over EasyData Machine Learning projecten? klik dan hier!

Je dataset is bepalend

Zodra je ons benaderd voor een Machine Learning project gaat een van de eerste vragen over je gegevens. Wat wil je dat de machine gaat leren? Het materiaal dat we gebruiken om de machine (dus computer) noemen we een dataset.  Zonder dataset is je Machine Learning project kansloos.  Dat betekent overigens niet dat je zonder dataset geen Machine Learning project kan starten. De vraag bij afwezigheid van je dataset is waar we dan wél de gewenste data voor je project vandaan gaan halen. Veel datasets zijn gelukkig openbaar toegankelijk, bezoek bijvoorbeeld deze pagina om een indruk van beschikbare datasets te krijgen.

We gaan je Dataset trainen

Stel dat we je dataset hebben ontvangen of deze samengesteld uit openbare bronnen, via Webscraping of welke andere vorm van Data Capture dan ook, word je data getraind!  In die vervolgstap gaan we je data testen tegen het door ons geselecteerde Machine Learning netwerk. Op basis van onze kennis en ervaring maken we een selectie van afzonderlijke Machine Learning algoritmen die ook wel “Neural Networks” worden genoemd.  In de basis is het onderscheid tussen de verschillende algoritmen niet zo lastig te maken. Je kan je voorstellen dat een algoritme dat ontworpen is om geluid en stemmen te herkennen afwijkt van een algoritme dat ontwikkeld is voor tekstherkenning.

Je dataset getoetst aan de praktijk

We testen allereerst je data met het Machine Learning algoritme waarvan wij denken dat dit het beste resultaat voor specifiek jouw project geeft. We doen dat door grote hoeveelheden data naar het door EasyData geselecteerde algoritme te sturen.  Onze specialisten verwachten daar natuurlijk een bepaald resultaat mee te behalen. Blijft dat verwachte resultaat achter bij wat we wenselijk achten, kunnen we het algoritme veranderden. We downloaden dus niet ‘zomaar’ een Open Source Neural Netwerk en als het gewenste resultaat uitblijft pakken we de volgende, zo werkt dat niet. EasyData specialisten hebben uitgebreide Python kennis in combinatie met een stevige wiskundige achtergrond en zijn in staat het algoritme te veranderen.

Machine Learning en Datasets

De praktijk in je organisatie

Machine Learning krijgt pas betekenis als je deze succesvol toepast in je eigen organisatie.  Door gebruik te maken van deze innovatieve technologie blijf je niet alleen de concurrentie voor, je zorgt ervoor dat je collega’s met meer plezier naar hun werk komen.

Machine Learning advies

Laten we meteen maar voorbij je eerste implementatie kijken, het systeem werkt en de gestelde doelen worden gehaald. Dan wordt het zaak dit proces te monitoren. We maken je proces monitoring makkelijk een transparant monitor systeem bij de Machine Learning inrichting mee te leveren.  We doen dat veelal voor onze opdrachtgevers binnen Microsoft BI of andere visualisatie platform dat reeds in gebruik is. Heb je zoiets nog niet breed geïmplementeerd? Dan adviseren we Grafana dat we nu al in allerlei situaties inzetten en waar EasyData de afgelopen jaren veel ervaring mee heeft opgebouwd.

Machine Learning Tech Talk

Machine Learning betekenis

Om je machine (de computer) deelgenoot te maken van je voorgenomen leerproces is het van belang je wensen te vangen in een dataset. Die dataset kan bestaan uit tekstdocumenten, spraakberichten, video’s of iedere andere vorm van data die je kan bedenken.  Uitgangspunt voor de Data Specialisten van EasyData is dat we een patroon in jou data kunnen ontdekken.

Machine Learning voorbeeld

Zodra we met deze technologie aan het werk gaan staat het identificeren van patronen centraal. Die patronen vormen het fundament om tot een zelf lerend proces te komen. In dit geval zien we “Zelf Lerend” betekent in dit geval dat het ‘geleerde’ algoritme voorspellingen en beslissingen kan maken zonder dat daar specifieke programmeerinstructies voor ontwikkeld zijn. EasyData heeft zelf lerende algoritmen virtueel gesproken op de plank liggen in afwachting van jouw aanvraag. Die Zelflerende algoritme zien afzonderlijk van elkaar ontwikkeld voor beeldherkenning, spraakherkenning, natuurlijke taalverwerking (denk aan technieken zoals ChatGPT toont), voorspellende analyse, en andere data die in jouw specifieke voorbeeld aan de orde is.

Machine Learning en Datasets

Zelflerende techniek is vaak Python

Machine Learning krijgt pas betekenis als je deze succesvol toepast in je eigen organisatie.  Door gebruik te maken van deze innovatieve technologie blijf je niet alleen de concurrentie voor, je zorgt ervoor dat je collega’s met meer plezier naar hun werk komen.

Machine Learning advies

Voor het gemak gaan we ervan uit dat je begrip wenst te krijgen van hetgeen we opleveren aan jouw organisatie. Je hoeft daarvoor geen uitgebreide Python of wiskundige kennis mee te nemen, die taak nemen we graag van je over. Precies dat onderdeel is ons vak.

Jou Machine Learning Model

We gaan, als je dat wilt, samen een inventarisatie maken van de data die je wilt verwerken. De reden dat we je daar graag in bijstaan is onze kennis van openbare bronnen (Lees datasets) waar je vrij over kunt beschikken. Is eventuele ‘Nice ti have’ data niet direct beschikbaar hebben we diverse Webscraping tools in onze virtuele digitale gereedschapskist. Zo kan je zonder grote voorinvestering aan precies die data(set) komen die jouw zelflerende beslissingssysteem compleet maakt.

Zelf aan de knoppen met jou zelflerende systeem

Met een beetje voorwerk kan je architectuur van onze zelflerende oplossing goed begrijpen. Zeker na de oplevering kan je aan de hand van ons architectuur schema het huidig werkende model begrijpen. Dat betere begrip van Machine Learning binnen jouw organisatie maakt het mogelijk dat intern zwakke punten van de oplossing aan de oppervlakte komen. En misschien zijn het niet zozeer fouten, maar meer beperkingen van het huidige model die nu, na oplevering, pas duidelijk naar voren komen.

Kijk opnieuw naar je Dataset

In zo’n werkend systeem krijg je vanzelf meer gelabelde gegevens. Als het goed is hebben we daar in de inrichting al rekening mee gehouden en kan je, afhankelijk van de opzet, vrijwel direct je dataset aanvullen. Een algemene regel in Data Science is dat als je over meer gelabelde gegevens beschikt, je automatisch betere resultaten krijgt.