Overview
Het DataNieuws is de nieuwsupdate van De Dataloog, dé Nederlandse podcast over Big Data, Data Science, Machine Learning en de datagedreven transformatie. Wij brengen de digitale datagedreven wereld dichtbij in het Nederlands en op een begrijpelijke manier.
Goed nieuws uit Nederland
Datales voor democratie? (Of slimme lobby vanuit de branche?) Acht brancheorganisaties uit de digitale sector gaan politici kennis bijbrengen over de werking van de digitale samenwerking en economie. Daartoe starten de partijen, samen met ECP en iPoort, de Digitale Binnenhof Academy. Politici krijgen kennis en achtergronden over onder andere cyberveiligheid, ontwikkelingen op het gebied van de cloud, dataverzameling en bescherming en ontwikkelingen op het gebied van kunstmatige intelligentie.
Digi-les voor politici is wel noodzakelijk, meent ook IT-politicus van 2020 Jan Middendorp. “Digitalisering moet niet meer het thema van een IT-specialist of digitaliseringspecialist in een partij zijn. Het thema is veel breder van belang geworden. Elk Kamerlid moet ook een digitaal Kamerlid worden.”
Dit jaar heeft Tweede Kamerlid Jan Middendorp (VVD) voor zijn werk de award IT-politicus van het jaar 2020 gekregen. De afgelopen jaren stak hij zijn energie in het op de Kameragenda krijgen van onderwerpen als de digitale weerbaarheid van onze democratie, algoritmen en een betere digitale overheid. Na een nominatieronde en online stemming onder lezers van AG Connect krijgt Middendorp voor zijn werk de award IT-politicus van het jaar 2020.
Goed nieuws uit de wereld
IE-exit
Windows 10 raakt over zo’n twee maanden één van zijn drie ingebouwde browsers kwijt. Microsoft voert dan een update door die de oorspronkelijke Edge-browser verwijdert. Die ooit geheel nieuw opgebouwde opvolger voor Internet Explorer is zelf weer opgevolgd, en is dus Legacy Edge geworden. De support stopt ruim een maand vóór de verwijdering.
Microsoft kwam, zag, overwon (eerste browser wars, versus Netscape), stagneerde (IE6), verloor (derde browser wars, versus Chrome), herzag en gaf/pushte (Edge), verloor weer/nog altijd, herzag (Chromium) en ontneemt straks (IE11 en Legacy Edge).
Kwantum in de cloud
Tegelijkertijd met het verleden pakt Microsoft ook de toekomst aan. Het bedrijf heeft de beperkingen verwijderd van de bèta-versie van Azure Quantum, de clouddienstverlening waarmee geïnteresseerden hun eerste bewerkingen op een kwantumcomputer kunnen uitvoeren.
De dienstverlening kwam al in mei beschikbaar, maar toen alleen nog voor een beperkt aantal genodigden. Nu staat die mogelijkheid tot experimenteren voor iedereen open.
Academisch nieuws
Afzetten tegen ‘model-itis’
Onderzoekers zouden zich los moeten maken van het technische detailwerk aan neurale netwerken en meer aandacht moeten besteden aan taken op een hoger abstractieniveau, stelt Stanford University-hoogleraar Chris Re. Hij doelt daarmee onder meer op betere mogelijkheden om domeinexpertise toe te kunnen passen bij kunstmatige intelligentie.
Sinds het werk aan AI-modellen zoals Google BERT en GPT van OpenAI zijn modellen ‘commodities’ geworden die je zo van de plank trekt. Het tweaken aan nuances in de architectuur en het finetunen van de hyperparameters noemt Re een “obsessie” van onderzoekers. Volgens hem gaat het om de “long tail of distributions”, de details die zelfs de grote krachtige modellen in verwarring brengen. Waar het misgaat, is in de “subtiele interacties, subtiele dubbelzinnigheden in gebruikte termen”. Daar kan veel werk gedaan worden aan “fijnmazig redeneren en kwaliteit”.
Om daarmee aan de slag te gaan, is een nieuwe manier nodig om dit soort systemen te bouwen en aandacht voor nieuwe “failure models” voor AI. Re verwees daarvoor ook naar een blog van Andrej Karpathy, een AI-specialist van Tesla die schreef over AI als Software 2.0. Re vindt het zinvoller daarmee aan de slag te gaan dan tijd te verdoen aan “non-jobs for engineers”.
De parallel valt te trekken met de software-industrie van eind vorige eeuw: van maatwerk naar COTS.
Het doel van het voorgestelde Software 2.0 is de mens weer een belangrijke plek te geven in het proces. Het gaat erom dat de mens centraal staat, en dat barrières worden weggenomen voor de mensen met domeinexpertise die nu moeite hebben de machine daarover te leren.
AI-verbruik
Hoeveel energie mag kunstmatige intelligentie kosten? De energiekosten voor het ontwikkelen van algoritmen met behulp van neurale netwerken rijzen de pan uit. Als de trend doorzet, komt het onderzoek naar toepassingen van kunstmatige intelligentie in de handen van een handvol zeer kapitaalkrachtige technologiegiganten te liggen. En die hebben niet per se primair de maatschappelijke ontwikkelingen voor ogen, stellen critici. Anderen zien de kosten en het energieverbruik als kinderziekten van een nieuwe technologie die vanzelf verdwijnen als de vrije markt zijn werk doet.
Het trainen van een bekend algoritme voor natuurlijke taalverwerking – Bidirectional Encoder Representations from Transformers (BERT) – kost grofweg evenveel als een retourvlucht van een volle Boeing 747 tussen New York en San Francisco, berekenden onderzoekers (pdf) van het Amherst -lab van de University of Massachusetts. Maar dat algoritme is alweer achterhaald. Een nieuwer model GPT-3 heeft door betere training al een ruim 100 keer hogere nauwkeurigheid dan BERT.
Nederlands-Franse coalitie
De Nederlandse AI-coalitie gaat samenwerken met het Franse nationale AI-initiatief. De twee nationale AI-coalities willen er zo voor zorgen dat zoveel mogelijk ondernemers en onderzoekers de vruchten kunnen plukken van AI. Ze richten zich daarbij onder andere op het mkb, startups en scale-ups. Ook gaan ze onderzoeken of AI-producten een keurmerk moeten krijgen dat de hoge standaard ervan waarborgt.
De twee coalities zullen onderzoeken hoe het mkb optimaal gebruik kan maken van AI. Ook zullen beide landen landbouwdata gebruiken om de mogelijkheden van AI voor boeren te vergroten. Bovendien wordt het ondernemers en onderzoekers makkelijker gemaakt samen EU-subsidies aan te vragen. Zij kunnen voor nieuwe uitvindingen rekenen op meer steun vanuit beide overheden. Ook gaan beide landen onderzoeken wat AI voor de gezondheidszorg kan betekenen. Later dit jaar wordt nog een aparte innovatiemissie op het gebied van AI en gezondheid georganiseerd.
Feit of fictie?
De eerste cyborg op aarde werkt nu aan Parkinsononderzoek, en zegt: “Over vijftig jaar willen mensen graag een chip in hun brein”.
(Zie ook stappen in die richting door Tesla-grondlegger Elon Musk met zijn Neuralink dat chips op hersenen wil aansluiten. De grensverleggende zakenman heeft in augustus een varken met een chip in z’n hersenen getoond.
Securitynieuws
AI voor security
AI als spil in cybersecurity maar dan met menselijke supervisie? Kan, maar in de dagelijkse praktijk spelen er nog meer basale problemen dan AI voor (of tegen) ICT-security.
VN-datacentra in China
Minister Blok: geen zorgen over plaatsen VN-datacentra in China. De bewindsman stelt dat de beoogde VN-datacentra in China gebruik gaan maken van vrij beschikbare gegevens, “zoals bijvoorbeeld scheepvaart tracking gegevens (AIS) of geografische gegevens (OpenStreetMap)”. De bewindsman verzekert dat er geen vertrouwelijke Nederlandse data, zoals bijvoorbeeld persoonsgegevens, terechtkomen bij de VN-databases in China.
Bovendien vormen die nieuwe Chinese datacentra onderdeel van een bredere opzet, in meerdere landen. “Naast het United Nations Global Geospatial Knowledge and Innovation Centre in [de Chinese stad – red.] Deqing zijn op regionaal niveau drie regionale hubs opgericht, namelijk in China (Hangzhou), Rwanda en de Verenigde Arabische Emiraten. Een vierde regionale hub wordt opgericht in Rio de Janeiro”, laat Blok weten.
Privacynieuws
Uitbreiding voor datatoezichthouder AP
De Autoriteit Persoonsgegevens (AP) moet in 2022 flink meer budget gaan krijgen, zodat de toezichthouder kan groeien. Dat heeft de Tweede Kamer vorige week bepaald door een motie hierover aan te nemen. Tijdens het debat over het GGD-datalek vorige week constateerden diverse Tweede Kamerleden dat de Autoriteit Persoonsgegevens nu te weinig mankracht heeft om zijn taken goed uit te voeren. Dit niet alleen met betrekking tot ‘gewoon’ datalekken, maar ook de macht van de grote techbedrijven.
Bovendien was eerst nog bepaald dat het AP-budget in 2022 flink omlaag zou gaan: van 24,6 miljoen euro in 2021 naar iets meer dan 18 miljoen euro volgend jaar. Dat is nu gecorrigeerd, wat door bijvoorbeeld Bits of Freedom wordt toegejuichd.
Tijd en nu dus ook budget voor de AP om volwassen te worden?
Cloudnieuws
Groei en achteruitgang
De algehele cloudmarkt groeit, aangejaagd door de wereldwijde coronacrisis. Toch zien Europese clouddienstverleners hun aandeel achteruit gaan. Het zijn dus vooral de Amerikaanse cloudreuzen zoals Amazon, Microsoft en Google die profiteren van het toenemende cloudgebruik. Deze drie aanvoerders van de internationale cloudmarkt zijn de laatste jaren sterk gegroeid. De totale omzet in de Europese cloudmarkt bedroeg in het derde kwartaal van vorig jaar 5,9 miljard euro. Het gros daarvan gaat naar de grote aanbieders, die dus steeds groter worden.
De data-uitagenda/Events
Women in Data Science Worldwide Conference
(8 maart 2021, online)
Women in Data Science (WiDS) draait om inspiratie en (bij)leren voor data scientists van alle geslachten, én om het steunen van vrouwen die al werken op dit gebied. Het WiDS-initiatief is ontstaan op de Stanford University, maar de conferentie omvat nu 60 landen en combineert in de loop van 24 uur zo’n 150 verschillende events. De conferentie valt samen met Internationale Vrouwendag en brengt dan experts naar voren op het gebied van Big Data, data science en AI. De experts komen uit de wetenschapswereld, het bedrijfsleven, de overheidssector en nonprofits.
World Data Summit 2021
(19-21 mei, virtueel hybride event: online en in Amsterdam)
De 2021-editie van de World Data Summit verkent hoe en waarom slechts 3 procent van alle vergaarde data terecht komt in wat het ‘big data-ecosysteem’ wordt genoemd. Thoughtleaders geven hun visie op analytische modellen, het gebruik van data om meer klanten te bereiken, het werken met ongestructureerde data, en het inzetten van datavisualisatie. Dit evenement wordt nu deels online gehouden en biedt workshops, netwerkmogelijkheden, brainstormsessies, en meer.
Applied AI Summit 2021
(24 februari, online)
Een evenement van slechts een halve dag, maar dat volgestouwd met vooraanstaande experts op het gebied van AI en machine learning. Deze deskundigen zijn afkomstig van datagiganten als Google en Facebook, plus zakenbank Goldman Sachs en verzekeraar Anthem Insurance, maar komen ook uit de wetenschappelijke wereld. Enkele opvallende namen zijn Peter Norvig (research director bij Google), Alon Halevy (director AI bij Facebook), Bindu Reddy (CEO van Abacus.ai).