Een vraag over het gebruik van Google-spreadsheets riep overigens tegenstrijdige (en dus interessante) meningen op, Gebruiken sommigen van jullie de Google Documenten-spreadsheet om je statistische werk uit te voeren en met anderen te delen?
Ik denk aan een ouder artikel dat niet zo pessimistisch leek, maar het wordt slechts marginaal aangehaald in het artikel dat u noemde: Keeling en Pavur, Een vergelijkende studie van de betrouwbaarheid van negen statistische software pakketten (CSDA 2007 51: 3811). Maar nu vond ik de jouwe op mijn harde schijf. Er was ook een speciale uitgave in 2008, zie speciale sectie over Microsoft Excel 2007, en meer recentelijk in de Journal of Statistical Software: On the Numerical Accuracy of Spreadsheets.
Ik denk dat het een langdurig debat is, en je zult verschillende papers / meningen vinden over de betrouwbaarheid van Excel voor statistische berekeningen. Ik denk dat er verschillende discussieniveaus zijn (wat voor soort analyse bent u van plan te doen, vertrouwt u op de interne oplosser, zijn er niet-lineaire termen die een bepaald model invoeren, enz.), En er kunnen bronnen van numerieke onnauwkeurigheid ontstaan als resultaat van juiste rekenfouten of ontwerpkeuzes problemen; dit wordt goed samengevat in
M. Altman, J. Gill & M.P. McDonald, Numerical Issues in Statistical Computing for the Social Scientist , Wiley, 2004.
Nu zijn er voor verkennende gegevensanalyse verschillende alternatieven die verbeterde visualisatiemogelijkheden bieden , multivariate en dynamische afbeeldingen, bijv GGobi - maar zie gerelateerde discussies op deze wiki.
Maar het eerste punt dat u maakte, lost duidelijk een ander probleem op (IMO), namelijk dat van het gebruik van een spreadsheet om grote dataset: het is simpelweg niet mogelijk om een groot csv-bestand in Excel te importeren (ik denk aan genomische data, maar het is van toepassing op andere soorten hoog-dimensionale data). Het is niet voor dat doel gebouwd.