Overview

Terugkomend op De Dataloog van 4 weken terug: data is veel geld waard, bv zo’n 2 ton voor Maastricht University. Dat was het losgeldbedrag dat dit slachtoffer van ransomware na wikken en wegen besloten heeft te betalen. Want anders konden studenten niet studeren, professoren niet doceren, wetenschappers en onderzoekers niet onderzoeken, en zou reeds gecreëerde/vergaarde/gegenereerde wetenschappelijke data niet langer toegankelijk zijn.

Dus de waarde van data wordt pas duidelijker als het er niet meer is? Hier vallen wijze lessen van te leren, niet alleen voor de onderwijswereld maar voor iedereen eigenlijk.

Goed nieuws uit Nederland

AI is volgens onderzoek van IBM maar al te vaak nog slechts een proefproject. Dit valt ‘mooi’ samen met de constatering van begin vorig jaar dat veelbelovende, jonge aanbieders van AI eigenlijk niet echt AI gebruiken. Start-ups doen aan ‘AI-washing’.

Hierbij speelt ook gebrek aan inzicht en de soms blackbox-aard van veel AI-projecten en de algoritmes die daaraan ten grondslag liggen. De gemeente Amsterdam komt met een initiatief voor inkoopvoorwaarden voor algoritmes. “Een effectieve manier om grip te krijgen op de algoritmes die overheden gebruiken, is door goede afspraken te maken met leveranciers van algoritmes. Deze afspraken leggen we vast in contracten en inkoopvoorwaarden”, aldus de uitleg van Amsterdam.

De gemeente heeft het initiatief genomen om samen met Pels Rijcken en KPMG nieuwe contractvoorwaarden en inkoopvoorwaarden voor eerlijke en transparante algoritmes te ontwikkelen. Het begin is Amsterdamse voorwaarden maar deze zijn zo geschreven dat ze ook elderds door anderen gebruikt kunnen worden. Amsterdam is al geruime tijd actief op dit relatief nieuwe gebied: zo wil het algoritmes toetsen op kwaliteit. Naar aanleiding daarvan werkt de Nederlandse overheid aan een transparantielab voor algoritmes. Maar hoever moet of kan transparantie dan eigenlijk gaan?

Cloudnieuws

Over de kracht die ook zwakte is van IT: automatiseren en (voort)bouwen op de schouders van reuzen. Want: garbage in = garbage out, dit geldt voor data én voor (beheer van) clouds.

Geautomatiseerd cloudbeheer blijkt namelijk veel minder veilig dan gedacht. Handige scripts voor automatische configuratie van cloudinfrastructuur genieten toenemende populariteit bij devops-teams. Deze vorm van automatisering kan namelijk fouten door handwerk voorkomen. Maar wat als de gebruikte scripts of infrastructuur zelf kwetsbaarheden bevatten?

Een copy/paste-aanpak brengt dus eigen risico’s. Het nut van automatiseren door middel van templates en scripts staat niet ter discussie, maar wel het blind vertrouwen daarop. Het is natuurlijk ondoenlijk om alles zelf te doen, en onwenselijk om het wiel telkens opnieuw uit te vinden. Maar meer automatisering voor controle van templates en scripts?

Over het internationaal ‘aanslaan’ van de AVG. Californië heeft nu eigen privacywetgeving, die wel wat minder streng is dan de Europese AVG (GDPR in het Engels). Daar heeft Salesforce-CEO Marc Benioff in mei 2018 al voor gepleit: dat de VS een eigen GDPR moet krijgen. Silicon Valley’s thuisstaat Californië neemt nu de eerste stap.

Datasecurity- / privacynieuws

Duidelijkheid over SyRI: rechter fluit Nederlands overheidssysteem voor fraudedetectie terug. Het Systeem Risico Indicatie (SyRI) vormt een te grote inbreuk op het privéleven van burgers. Had dit niet voorzien kunnen worden, en dus voorkomen moeten worden? Moeten data-experts, IT’ers en datagebruikende organisaties niet wat meer kijken naar ongewenste of te ver gaande mogelijkheden? Kritische keuring vooraf, met een ‘dissidente’ houding, kan veel leed achteraf schelen. Zoals dus ophef en een rechtszaak. En mogelijk nog meer gevolgen.

Dit geldt niet alleen voor complexe overheidssystemen maar ook voor schijnbaar eenvoudige consumentenelektronica. Zoals de Ring-deurbel die in reclames flink wordt aangeprezen maar die ook flink aan datavergaren én datadelen doet, zo heeft de Electronic Frontier Foundation uitgezocht. Wordt dit in de gebruikersovereenkomst – die de meeste gebruikers niet eens lezen – wel aangekaart? Deels wel, in algemene termen, maar deels ook niet.

En daarbij speelt nog de beheer- en beveiligingskwestie van updates, waar de overheid nu met een campagne op aandringt. IoT-apparaten zoals de Ring maken het leven makkelijker, maar ook kwetsbaarder. Niet alleen fabrikanten of hun datapartners kunnen zo aan informatievergaring doen. Ook kwaadwillende derde partijen zoals cybercriminelen.

Academisch nieuws

Goede ideeën van studenten blijken in de praktijk niet altijd tot start-ups te kunnen leiden. Universiteiten kunnen namelijk aanspraak maken op intellectueel eigendom, wat start-ups in de weg kan staan. Minister Van Engelshoven (OCW) gaat samen met het VSNU werken aan richtsnoeren, die aanvankelijk zijn gemaakt om duidelijkheid te creëren maar die nu aanvulling behoeven.

Op het gebied van intellectueel eigendom spelen ook patenten, die alleen aan mensen toegekend kunnen worden. Laatst uitspraak van het Europees patentenbureau dat producten die het resultaat zijn van algoritmes níet gepatenteerd kunnen worden. Dit is ook interessant bij GAN’s (generative adversarial networks); genererende algoritmes.

Koeientaal: eindelijk weten we hoe koeien hun emoties met elkaar delen (met dank aan Roos Vonk). Australische wetenschappers hebben verschillende loeigeluiden van koeien bestudeerd en komen tot de conclusie dat de dieren elkaar op individualistische wijze vertellen hoe ze zich voelen.

De uitgaansagenda

19 februari: meetup (Eindhoven) De Grote Dataroof, vertoning van VPRO Tegenlicht-uitzending gevolgd door debat over Google en Facebook.

20 februari: workshop (Amsterdam) over Kubernetes en meer, bij AWS door senior solutions architect Kobi Biton.

26 februari: meetup (Amsterdam) PyData, de internationale gemeenschap van gebruiker en developers van data-analysetools.

5 maart: meetup (Utrecht) Stateful Function-as-a-Service, over voor- én nadelen van een serverless aanpak, door Viktor Klang (Lightbend), Stephan Ewen (Ververica) en Adil Akhter (ING).

10 maart: meetup (Amsterdam) Pie & AI, AI-kennisuitwisseling geïniteerd door Deeplearning.ai.

26 maart: Factbased Improvement Day (Amsterdam), over waarde uit data, bij Hot ITem.

16 april: Securitycongres (Veenendaal) van AG Connect.