De meeste mensen hebben een hekel aan het vak statistiek als ze gaan studeren.
Toch heeft bijna iedereen die een wetenschappelijk onderzoek doet statistiek nodig. Ook de overheid, het bedrijfsleven en natuurlijk het CBS. Daarom wordt er op HBO-opleidingen veel aandacht aan besteed.
Er zijn verschillende soorten statistiek en dus ook verschillende softwarepaketten. Het meest gebruikt is het gesloten pakket ‘SPSS’, dat onlangs door IBM is aangekocht. Dit programma wordt op veel hogescholen gebruikt, geleend, en gekopieëerd. Het is een krachtig programma maar helaas geen open source, en de data wordt niet opgeslagen in een open standaard.
Met andere woorden, als je eenmaal in SPSS werkt kan je niet makkelijk overstappen, en ook gegevens van anderen kan je alleen maar gebruiken als je zelf ook SPSS koopt. En dat is best duur, rond de 1400 USD (maar er zijn wel kortingen voor de educatieve sector).
De open source tegenhanger heet… PSPP. Het kan ongeveer hetzelfde als SPSS maar het is gratis en open. Andere open source pakketten zijn gretl, R, en de meer algemene wiskundepakketen zoals SAGE. Op Wikipedia staat een mooie lijst met open en gesloten statistische software, waarbij vooral opvalt dat de gesloten pakketten vaak erg duur zijn.
Het pakket ‘R’ biedt veel meer mogelijkheden voor statistische analyse, terwijl PSPP veel op SPSS probeert te lijken. Voor studenten is de aanschaf van SPSS vaak te duur en in onze eigen ‘K-Zone’ en op de UNA (sorry, UoC) zou onderzocht kunnen worden of de open source variant PSPP geschikt is.
Mocht PSPP niet voldoende mogelijkheden bieden, dan kunnen onze Informatica studenten deze er zelf bijprogrammeren en op die manier kan Curaçao – statistisch gezien -een bijdrage leveren aan het wereldwijde software arsenaal.