De keuze van n = 30 voor een grens tussen kleine en grote steekproeven is slechts een vuistregel. Er is een groot aantal boeken dat (rond) deze waarde citeert, bijvoorbeeld, Hogg en Tanis ' Kans en statistische inferentie (7e) zegt "groter dan 25 of 30".
Dat gezegd hebbende, het verhaal dat me werd verteld, was dat de enige reden dat 30 als een goede grens werd beschouwd, was omdat het ervoor zorgde dat mooie Student's t -tabellen achterin leerboeken mooi op één pagina pasten. Dat, en de kritische waarden (tussen Student's t en Normaal) zijn hoe dan ook slechts ongeveer 0,25 verwijderd van df = 30 tot df = oneindig. Voor handmatige berekeningen deed het verschil er niet echt toe.
Tegenwoordig is het gemakkelijk om kritische waarden voor allerlei dingen tot op 15 decimalen te berekenen. Bovendien hebben we methoden voor resampling en permutatie waarvoor we niet eens beperkt zijn tot parametrische populatieverdelingen.
In de praktijk vertrouw ik nooit op n = 30. Teken de gegevens uit . Leg er een normale verdeling overheen, als je wilt. Beoordeel visueel of een normale benadering geschikt is (en vraag of een benadering echt nodig is). Als het genereren van steekproeven voor onderzoek en een benadering verplicht is, genereer dan genoeg van een steekproefomvang om de benadering zo dicht mogelijk te maken als gewenst (of zo dicht als rekenkundig haalbaar).