Analytics

Möbius en LoQutus hacken de bibliotheek van Gent

Ik ben een grote fan van de open geest van de ‘smart city’ innovatie, die het initiatief nam voor “Apps for Ghent”. Daarom hebben mijn Loqutus-collega’s en ik besloten om de configuratie van onze data cleaning en Qlik Sense publiek te maken.
Jeroen Colin

Op zaterdag 21 maart nam ik deel aan “Apps for Ghent”.

Samen met haar digitale partners organiseerde de stad Gent deze hackathon – helemaal in de geest van de evolutie naar ‘smart cities’ – om liefhebbers van open data, ontwikkelaars en actief deelnemende burgers samen te brengen tijdens een co-creatie evenement. Omdat ik mij wel herken in elk van deze drie eigenschappen, besloot ik om op die regenachtige, vroege lentezaterdag te gaan ‘hacken’. Om in de loop van die zaterdag ook maar iets te kunnen bereiken, moest ik een team vormen met andere deelnemers die ook gek zijn van data. Gelukkig waren er twee Loqutus-collega’s, die net als ik dolenthousiast waren om deel te nemen aan dit evenement. Het evenement, ‘hack de bib’ genaamd, was gericht op potentiële nieuwe en verhelderende toepassingen voor de data van de bibliotheek van Gent.

Voor het eerst in de geschiedenis zou de data van de bibliotheek vrijgegeven worden aan het publiek. Twee weken voordien werd er een “datadive” georganiseerd en werden de datasets die men aan ons zou vrijgeven, getoond. Het gaat over meer dan 35 miljoen (anoniem gemaakte) ontleningen van boeken van meer dan 250.000 leden die meer dan 500.000 boeken lazen. De data zelf zou pas de dag voor het evenement vrijgegeven worden, en om het allemaal nog wat spannender te maken, liet de drijvende kracht achter het open data-initiatief in Gent, Bart Rosseau, ons weten dat “het niet zal lukken met huis-, tuin- en keukenmateriaal” om dit probleem aan te pakken. Het spreekt voor zich dat de druk heel groot was.

Mijn Loqutus-collega’s en ik besloten om een platform te bouwen om snel conclusies te trekken uit de geleverde data. We hebben dit platform gebouwd met de open-source statistische programmeertaal R en de visualisatietool Qlik Sense. Het platform laat de gebruikers toe om zelf de uitgebreide dataset te doorbladeren en te onderzoeken en informatieve dashboards te maken. Zo’n selfservice BI (Business Intelligence)-omgeving geeft een grote meerwaarde aan het gebruik van data ter ondersteuning van discussies gebaseerd op feiten en kan een bedrijf (in dit geval de bibliotheek van de stad Gent) van richting doen veranderen. Ik ben ervan overtuigd dat in de context van een ‘smart city’ dergelijke omgevingen steeds meer aan populariteit zullen winnen, omdat ze discussies uitlokken en gebruikers hun opinie laat onderbouwen met duidelijke en mooi weergegeven data.

Dit is wat we bereikt hebben tijdens de zes uur durende hackathon:

  • We hebben een code geschreven om snel data cleaning-acties te kunnen uitvoeren;
  • We hebben onze ‘cleaning’ code gecombineerd met gebruikersdocumentatie;
  • We hebben enkele zeer intuïtieve dashboards gebouwd;
  • Wat uiteindelijk een reproduceerbare analyse opleverde (m.a.w. een meerwaarde voor de bibliotheek en haar gebruikers).

Tegen het einde van het evenement konden we een leden dashboard weergeven met de evolutie van het aantal leden tussen 1996 en 2015, de leden per statistische sector van Gent en de leden per geboortedecennium. Bovendien hebben we een boeken dashboard gemaakt, dat de evolutie van het ontlenen van een bepaald boek over de jaren weergeeft, de populairste boeken van een bepaalde auteur en een legendarische piek in 2008 in het ontlenen en lezen van “Het Verdriet van België”, toen de auteur Hugo Claus overleed. Met schaamrood op de wangen moet ik toegeven dat ik dit meesterwerk zelf nog niet gelezen heb.

Ik ben een grote fan van de open geest van de ‘smart city’ innovatie, die het initiatief nam voor “Apps for Ghent”. Daarom hebben mijn Loqutus-collega’s en ik besloten om de configuratie van onze data cleaning en Qlik Sense publiek te maken. U vindt de data cleaning op Rpubs en de Qlik Sense-configuratie op SlideShare.

Ik moet de mensen die naar het resultaat kijken van onze deelname aan deze zes uur durende hackathon waarschuwen dat het resultaat niet mooi afgewerkt is. Maar wat ik meeneem uit deze ervaring is dat ik een soortgelijke benadering durf voor te stellen voor eender welk data-initiatief, zoals het verwerken van ruwe data of het opzetten van een sandbox om snel waardevolle resultaten uit deze data te halen.

Neem gerust contact met ons op voor meer informatie!

Bedankt voor het lezen

Contacteer onze expert

Jeroen Colin