Bijgewerkt
De vraag vraagt ons om te kiezen tussen de methode van Pearson en Spearman wanneer de normaliteit in twijfel wordt getrokken. Beperkt tot deze zorg, denk ik dat het volgende artikel de beslissing van iemand zou moeten informeren:
Het is best aardig en geeft een overzicht van de aanzienlijke hoeveelheid literatuur over dit onderwerp die tientallen jaren beslaat - beginnend bij Pearson's "verminkte en vervormde oppervlakken" en de robuustheid van de distributie van $ r $. Ten minste een deel van de tegenstrijdige aard van de "feiten" is dat veel van dit werk werd gedaan vóór de komst van rekenkracht - wat de zaken ingewikkeld maakte omdat het type niet-normaliteit in overweging moest worden genomen en moeilijk te onderzoeken was zonder simulaties.
Kowalski's analyse concludeert dat de distributie van $ r $ niet robuust is in aanwezigheid van niet-normaliteit en beveelt alternatieve procedures aan. Het hele artikel is vrij informatief en aanbevolen om te lezen, maar ga voor een samenvatting naar de zeer korte conclusie aan het einde van het artikel.
Als je wordt gevraagd om te kiezen tussen een van Spearman en Pearson wanneer de normaliteit wordt geschonden, een verspreidingsvrij alternatief is het aanbevelen waard, namelijk de methode van Spearman.
Eerder ..
Spearman's correlatie is een op rang gebaseerde correlatiemaatstaf; het is niet-parametrisch en berust niet op een aanname van normaliteit.
De steekproefverdeling voor Pearson's correlatie veronderstelt normaal; Dit betekent in het bijzonder dat, hoewel u het kunt berekenen, conclusies op basis van significantietesten mogelijk niet deugdelijk zijn.
Zoals Rob in de commentaren aangeeft, is dit bij grote steekproeven geen probleem. Bij kleine steekproeven, waar de normaliteit wordt geschonden, verdient Spearman's correlatie de voorkeur.
Update Als ik nadenk over de opmerkingen en de antwoorden, lijkt het mij dat dit neerkomt op het gebruikelijke debat over niet-parametrische versus parametrische tests. Veel van de literatuur, b.v. in biostatistiek, behandelt geen grote monsters. Ik ben over het algemeen niet arrogant als ik op asymptotica vertrouw. Misschien is het in dit geval gerechtvaardigd, maar dat is mij niet direct duidelijk.