Vanaf dinsdag 7 februari volg ik een cursus datajournalistiek. In vier lesavonden probeer ik meer structuur in mijn werk te vinden en heb ik een excuus om met data te spelen.
Wat is een typische Academy Award-winnende film? Het is geen diepgravende, journalistieke vraag, maar het is wel de opdracht waar ik mee aan de slag ga tijdens de cursus datajournalistiek van de Hogeschool Utrecht. En daar blog ik de aankomende weken dan weer over.
Samen met Femke Nales, Heinze Havinga en Martijn Bekhuis heb ik afgelopen jaar RegioHack georganiseerd: een datajournalistiek project waarin wij journalisten, programmeurs en studenten met elkaar laten samenwerken. Om de knelpunten van datajournalistiek te ontdekken, zijn we tijdens een 30-urige hackathon in het diepe gedoken.
Maar dat was ‘freewheelen’: we werkten zonder plan van aanpak. Nu wil ik structuur in mijn werk aanbrengen. Waar begin je? Hoe pak je een flink project aan? En welke mogelijkheden heb je tijdens zo’n proces?
Om zoveel mogelijk technieken in de vingers te krijgen, zocht ik in de aanloop naar de cursus een onderwerp waar veel verschillende disciplines in zitten verwerkt. Dat onderwerp vond ik al een tijdje geleden in de Academy Awards. Hoe ziet een typische Oscar-winnaar eruit?
De lijst met alle winnaars in de categorie Beste Film is een mooi beginpunt. Aan deze overzichtelijke dataset probeer ik zoveel mogelijk verschillende onderzoeksmethoden te koppelen. Ik heb al een klein lijstje aan suggesties om te onderzoeken.
Volgens mij kun je met de antwoorden op die vragen een hele interessante visualisatie maken. Alleen heb ik de data nodig om dat voor elkaar te krijgen. Om zoveel mogelijk informatie boven water te krijgen, heb ik hulp via Twitter ingeschakeld.
Welke interessante, vreemde of uitgebreide databases over films (of Academy Awards) zijn er? RT = aardig, hulp = veel dank in blogje. #dtv
— Jerry Vermanen (@JerryVermanen) February 7, 2012
Hierop kreeg ik de volgende antwoorden. Ontzettend bedankt! Meer suggesties voor onderzoeksmethodes of datasets zijn welkom via de comments. Aankomende week bekijk ik welke informatie ik kan gebruiken.
@JerryVermanen Misschien de dataset van afgelopen @infobeautiful award? Veel data van afgelopen 5 jaar Hollywood » bit.ly/hollywoodbudge…
— David Graus (@dvdgrs) February 7, 2012
@JerryVermanen strikt genomen denk ik dat imdb.com wel voldoet aan de eis ‘uitgebreide database over films’ 😉
— David Graus (@dvdgrs) February 7, 2012
@JerryVermanen IMDB kun je evt. ook scraperless benaderen met onofficiële (geloof ik) API » imdbapi.com
— David Graus (@dvdgrs) February 7, 2012
@JerryVermanen imdb.com en filmtotaal.nl en film.startpagina.nl en movies.about.com en oscars.org #dtv
— Marionne van Woensel (@Marionne2205) February 7, 2012
@JerryVermanen freebase heeft een grote film afdeling en wikipedia heeft ook hele tabellen rondom films die je kan importeren in google docs
— HeinzeHavinga (@HeinzeHavinga) February 8, 2012
@JerryVermanen Rotten Tomatoes heeft een leuke API developer.rottentomatoes.com
— Anne Postma (@A_Postma) februari 8, 2012