Overview
DTL017 – Fraude detectie – de use cases en algoritmes
Wist je dat Fraude gevallen de Nederlandse maatschappij ongeveer 10x meer geld kosten dan het fileprobleem? Wist je dat Fraude voorkomt in alle branches van retail tot verzekeringen, van telecom bedrijven tot de overheid? De Dataloog spreekt met Richard Bakker van Future Facts over diverse use cases van fraude detectie.
We leren tijdens deze uitzending niet alleen hoe je fraude gevallen moet detecteren met algoritmes maar we hebben ook heel veel geleerd over hoe je zelf fraude kunt plegen. Mooie verhalen horen we over spookfacturen, frauduleuze claims bij verzekeringen, regel verval in supermarkten en het oplichten van overheden. Genoeg informatie om een zakcentje bij te verdienen.
Ook horen we welke algoritmes werken en niet werken. Waarom verzekeringen liever wel uitkeren dan vals alarm hebben en wat STP is.
Trouwens, hoe vind je in je data gelabelde fraude cases? Want nu zijn zowel de niet fraude als wel fraude cases niet gelabeld immers we weten het niet zeker. En kijk je naar echte features of naar het sentiment in de teksten ingevuld in de vrije velden?
Kortom een spannende uitzending over alles wat met fraude te maken heeft en de hoop dat Data Science dit grote maatschappelijke probleem kan oplossen.
OVER RICHARD BAKKER
Richard is Senior Consultant Business Analytics. Hij is toegepast wiskundige afkomstig van de universiteit Eindhoven. Zijn expertise ligt in het toepassen van datagedreven oplossingen binnen het vakgebied van Risk Management en Finance. Naast zijn consultancywerkzaamheden houdt Richard zich bezig met het ontwikkelen van nieuwe diensten, zoals fraudedetectie- en forecasting modellen.
Shownotes
Minder supermarkten want Picnic gaat het winnen
Aanklacht leden cSuite ING vanwege fraude zaak
https://nos.nl/artikel/2275675-medewerker-rijkswaterstaat-verdacht-van-grootschalige-fraude.html
Master data sheet
En dan nep facturen
Amsterdam 4e stad te wereld op tech in de wereld
UWV case vakantie fotos facebook fotos
https://www.facebook.com/UWVnl/photos/a.1711554465758405/1977378355842680/?type=3
Woordkeuze analyse?
Ensemble stacking en High precision modellen -> Even uitleggen:
- Je neemt diverse modellen die je op high precision traint of iets wel/niet een fraude case is. high precision wil zeggen dat ze op zeer nauwkeurig en alleen op bepaalde labels een TRUE geven.
- Als één van de diverse algoritmes die je in je ensemble learning gebruikt een TRUE geeft beschouw je de voorspelling als TRUE
https://blog.statsbot.co/ensemble-learning-d1dcd548e936
www.analytics-magazine.org/networks-vs-fraud-connecting-the-dots
media markt kassière fraude https://m.omroepwest.nl/nieuws/3581353