You are here

Twee keer sneller zoeken

Uit enorme bergen data dat ene bestandje te voorschijn toveren, zonder dat het uren duurt; dankzij Mrunal Gawade lukt dat nu een stuk sneller.

“Mijn techniek heeft de wereld verbeterd, maar je zult het niet merken”

Mrunal Gawade staat op het punt om te promoveren, maar hij is totaal niet zenuwachtig voor de ceremonie. 'Ik ben al meer dan zes maanden klaar met de eerste versie van mijn proefschrift. Dus ik had veel voorbereidingstijd en ben inmiddels niet meer nerveus.' Gawade promoveert in de database-groep van het CWI. Hij werkt met en aan de open source software van MonetDB solutions, waarvan zijn promotor Martin Kersten de CEO is. Gawades missie was om computercores zo efficiënt mogelijk te gebruiken en zo uit een enorm complexe database zo snel mogelijk informatie te halen. Maar hoe hak je de zoekopdracht het best in stukjes en hoe verdeel je ze over verschillende rekenkernen?

'Het was een heel lastig probleem', zucht Gawade. 'Gebruik je één core of honderd? Hoe wordt de zoekopdracht verdeeld? Hoe werken software en hardware samen? Uiteindelijk heb ik een zelflerend systeem ontwikkeld. Het past zich aan gebaseerd op de feedback die het krijgt van de vorige uitgevoerde opdrachten. Stel je hebt een machine met 100 cores. Dan begin ik met één core als referentie. Het systeem leert dan hoeveel hij kan met die ene core, en voegt er iets aan toe. Net zolang tot hij weet dat hij bijvoorbeeld aan 50 cores genoeg heeft. Uiteindelijk is mijn techniek tot wel 50% sneller dan de techniek waar ik mee begon.'

Gawades techniek is geen extreme doorbraak. 'Maar iets wat eerst een seconde duurde, kost nu nog maar een halve. Mijn techniek heeft de wereld verbeterd, maar je zult het niet merken, want de wereld is al heel goed. Je merkt geen dingen in technologie, behalve als ze stuk gaan. Je voelt niet dat er iets op de achtergrond gebeurt, dat mensen heel hard werken achter de schermen om jouw leven simpeler te maken.'

Hardcore aan het werk
Dat Gawade tegen het eind van zijn promotie nog onderzoekstijd overhoudt, dankt hij aan zijn harde werk. 'Ik was extreem gefocust. Hardcore aan het werk. Drie jaar lang heb ik bijna niets anders gedaan dan werken en had ik geen sociaal leven. Maar dat stelde me wel in staat om de volledige controle over mijn onderzoek te hebben. Ik zit daardoor nu in een comfortabele positie. Daar ben ik denk ik het meest trots op. Veel promovendi verliezen de focus en de motivatie en dan kost het enorme moeite om weer op het juiste spoor te komen. Ik loop een half jaar voor op schema, ben nu alleen nog aan het fijnslijpen.

Zo vroeg klaar met zijn onderzoek, een ander zou misschien nu vooral vakantie vieren en feesten, maar dat is niks voor Gawade. Liever maakt hij thuis muziek of gaat hij op pad met zijn fotocamera (zie ook mrunalg.com). 'Ik ben geen feestganger, niet echt een sociaal persoon, ik voel me niet prettig in zo'n omgeving. Netwerken doe ik daarentegen wel graag en daar heb ik nu ook tijd voor. Mijn sociale contacten zijn vooral werkgerelateerd. Daar leer ik veel van, dat is meteen nuttig voor mijn carrière.'

Eurekamoment
Hoewel Gawade nu tijd overhoudt, ging het niet altijd perfect. 'Aan het eind van mijn tweede jaar bleek de belangrijkste techniek die ik had bedacht niet veel verbetering te geven. De bestaande technieken waren gewoon al heel goed. Mijn techniek was wel een nieuwe manier om hetzelfde te doen, maar niet echt beter.' Gawade maakte geen vooruitgang en raakte gedeprimeerd. 'Ik kreeg stress en sliep nauwelijks. Het was een extreem slechte fase in mijn leven als onderzoeker.' Gelukkig vond Gawade dat zijn nieuwe techniek toch voordelen bood. 'Bij één zoekopdracht toont mijn techniek weinig verbetering, maar als je meer zoekopdrachten tegelijk laat uitvoeren en je echt het uiterste van je systeem vraagt, blijkt mijn techniek een stuk beter te werken. Ik gebruik minder resources, dus er is genoeg ruimte voor meerdere dingen om te gebeuren. Die realisatie was wel een eurekamoment. Ineens was mijn techniek beter dan andere systemen!'

Overleven
Gawade koos niet voor computer science omdat hij van kind af aan al met computers speelde. De keuze was vooral praktisch. 'Zoals de meeste mensen in India kiezen; in engineering en computer science zitten de meeste banen. Werk betekent geld, geld betekent overleven. Maar ik ben heel blij met mijn keuze. Als computer scientist heb je heel veel controle over wat je kunt doen, je hebt geen enorm lab nodig, het gaat er puur om hoe slim je bent en hoe goed je kunt programmeren. Met een simpele laptop kun je de mooiste dingen doen.'

De belangrijkste redenen om te kiezen voor een promotie in Nederland bij de onderzoeksgroep van het CWI waren dat Gawade na India en Amerika nu iets in Europa wilde doen, en dat vanuit deze groep al diverse bedrijven zijn gestart. 'Ik wilde ook een bedrijf starten en deze groep leek met een goed beginpunt. Ik heb ontzettend veel geleerd en niet alleen wat betreft inhoudelijke kennis een enorme stap gemaakt. Ik ben nu een heel ander persoon dan voor ik aan dit onderzoek begon. Ik bekijk dingen op een andere manier, probeer alles te analyseren. Maar dat hoort denk ik bij het PhD-proces.' Gawade is blij met zijn keuze voor Nederland, maar hij ziet toch nog wel een puntje voor verbetering. 'Je krijgt veel kansen, de onderzoeksomgeving is goed, er is funding. Maar de omgeving is soms een beetje te relaxed als je het mij vraagt. Als je iets meer competitie toevoegt, dan wordt het nog beter.'

 

Mrunal Gawade (1982) haalde zijn bachelor computer science aan de Vishwakarma Institute of Technology (India) en zijn master computer science aan de University of California at Santa Cruz (USA). Tussendoor werkte hij bij verschillende softwarebedrijven in India en richtte hij met een vriend een bedrijf op. In 2012 begon hij zijn promotieonderzoek aan het Centrum Wiskunde & Informatica in Amsterdam. 15 februari 2017 is hij succesvol gepromoveerd met het proefschrift ‘Multi-core parallelism in a column store’. Zijn onderzoek werd deels gefinancierd door Commit.

 

 

COMMIT/ project: TimeTrails (Spatiotemporal Data Warehouses for Trajectory Exploitation)
Ook dit is een COMMIT/ project