Vraag:
Welke referenties moeten worden aangehaald om het gebruik van 30 als een voldoende grote steekproefomvang te ondersteunen?
Lan
2010-09-10 22:07:39 UTC
view on stackexchange narkive permalink

Ik heb vaak gelezen / gehoord dat de steekproefomvang van ten minste 30 eenheden wordt beschouwd als "grote steekproef" (normaliteitsaannames van gemiddelden gelden meestal ongeveer vanwege de CLT, ...). Daarom genereer ik in mijn experimenten meestal monsters van 30 eenheden. Kunt u mij alstublieft een referentie geven die moet worden vermeld bij het gebruik van steekproefomvang 30?

Zonder verwijzing naar het aantal parameters dat u probeert in te schatten, of equivalent het soort model waarmee u werkt, lijkt het nogal moeilijk om u een duidelijk antwoord te geven.
Acceptatie van n = 30 als grens van kleine en grote steekproeven wordt niet goed ondersteund door enige statistische techniek.
Vier antwoorden:
#1
+43
Carlos Accioly
2010-09-11 00:42:17 UTC
view on stackexchange narkive permalink

Eigenlijk is het "magische getal" 30 een misvatting. Zie Jacob's Cohen's prachtige artikel, Things I Have Learned (So Far) (Am. Psych. December 1990 45 # 12, pp 1304-1312). Deze mythe is zijn eerste voorbeeld van hoe "sommige dingen die je leert niet zo zijn".

[O] Een van mijn collega-promovendi heeft een proefschrift [met] een steekproef van slechts 20 gevallen per groep. ... [L] ater ontdekte ik ... dat voor een twee-onafhankelijke-groep-gemiddelde vergelijking met $ n = 30 $ per groep bij de geheiligde twee- $. 05 $ niveau, de kans dat een middelgroot effect als significant zou worden bestempeld door ... een t -test was alleen $. 47 $ . Het was dus ongeveer een muntstuk of men een significant resultaat zou krijgen, ook al was de effectgrootte in werkelijkheid zinvol. ... [Mijn vriend] eindigde met niet-significante resultaten - waarmee hij een belangrijke tak van de psychoanalytische theorie sloopte.

Mooie referentie - en ter plaatse relevant. Dank je.
@whuber Weet je nog welk papier het was?De link is inmiddels verbroken.Misschien deze http://psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf, "Things I Have Learned (So Far)"?Het jaar komt overeen met het jaartal in de URL van de verbroken link.
@Amoeba Ik heb dit artikel bewaard toen ik het las, zodat ik kan bevestigen dat wat je hebt gevonden het bedoelde is.Ik heb dit antwoord bijgewerkt met een citaat samen met uw link.
@Carlos Accioly Ik heb het bijgewerkt met de nieuwe link omdat de vorige verbroken was.
#2
+39
user1108
2010-09-10 22:44:59 UTC
view on stackexchange narkive permalink

De keuze van n = 30 voor een grens tussen kleine en grote steekproeven is slechts een vuistregel. Er is een groot aantal boeken dat (rond) deze waarde citeert, bijvoorbeeld, Hogg en Tanis ' Kans en statistische inferentie (7e) zegt "groter dan 25 of 30".

Dat gezegd hebbende, het verhaal dat me werd verteld, was dat de enige reden dat 30 als een goede grens werd beschouwd, was omdat het ervoor zorgde dat mooie Student's t -tabellen achterin leerboeken mooi op één pagina pasten. Dat, en de kritische waarden (tussen Student's t en Normaal) zijn hoe dan ook slechts ongeveer 0,25 verwijderd van df = 30 tot df = oneindig. Voor handmatige berekeningen deed het verschil er niet echt toe.

Tegenwoordig is het gemakkelijk om kritische waarden voor allerlei dingen tot op 15 decimalen te berekenen. Bovendien hebben we methoden voor resampling en permutatie waarvoor we niet eens beperkt zijn tot parametrische populatieverdelingen.

In de praktijk vertrouw ik nooit op n = 30. Teken de gegevens uit . Leg er een normale verdeling overheen, als je wilt. Beoordeel visueel of een normale benadering geschikt is (en vraag of een benadering echt nodig is). Als het genereren van steekproeven voor onderzoek en een benadering verplicht is, genereer dan genoeg van een steekproefomvang om de benadering zo dicht mogelijk te maken als gewenst (of zo dicht als rekenkundig haalbaar).

Hier is een pagina over hoe goed de normale benadering van de t-verdeling precies is voor n = 30. http://www.johndcook.com/normal_approx_to_t.html
#3
+9
bhm
2010-09-10 23:41:43 UTC
view on stackexchange narkive permalink

IMO, het hangt er allemaal vanaf waar je je sample voor wilt gebruiken. Twee "gekke" voorbeelden om te illustreren wat ik bedoel: als je een gemiddelde moet schatten, zijn 30 waarnemingen meer dan genoeg. Als je een lineaire regressie moet schatten met 100 voorspellers, zullen 30 waarnemingen niet genoeg in de buurt komen.

#4
+9
user603
2010-09-11 00:05:05 UTC
view on stackexchange narkive permalink

Meestal willekeurige vuistregel. Deze bewering hangt af van een aantal factoren om waar te zijn. Bijvoorbeeld over de distributie van de data. Als de gegevens bijvoorbeeld afkomstig zijn van een Cauchy, zijn zelfs 30 ^ 30 waarnemingen niet voldoende om het gemiddelde te schatten (in dat geval zou zelfs een oneindig aantal waarnemingen niet voldoende zijn om $ \ bar {\ mu} ^ {(n)} $ om te convergeren). Dit getal (30) is ook onwaar als de waarden die u trekt niet onafhankelijk van elkaar zijn (nogmaals, het kan zijn dat er helemaal geen convergentie is, ongeacht de steekproefomvang).

Meer in het algemeen is de CLT heeft in wezen twee pijlers nodig om vast te houden:

  1. Dat de willekeurige variabelen onafhankelijk zijn: dat u uw waarnemingen kunt herschikken zonder enige informatie te verliezen *.
  2. Dat de rv komen uit een verdeling met eindige tweede momenten: wat betekent dat de klassieke schatters van gemiddelde en s.d. neigen te convergeren naarmate de steekproefomvang toeneemt.

(Beide aandoeningen kunnen enigszins verzwakt zijn, maar de verschillen zijn grotendeels van theoretische aard)

Uw voorbeeld illustreert de waarde van robuuste statistieken. De * steekproef mediaan * schat de locatieparameter van een Cauchy-distributie goed. Men zou kunnen stellen dat de zwakste schakel bij het gebruik van een t-test met 30 monsters de t-test is, niet de 30 monsters.
John:> "Je zou kunnen stellen dat de zwakste schakel bij het gebruik van een t-test met 30 samples de t-test is, niet de 30 samples". Zeer waar, en ook de aanname dat de gegevens * iid * zijn. De mediaan is ook MLE voor Cauchy-gedistribueerde willekeurige variabelen (en dus efficiënt), maar in het algemeen heb je meer dan 30 waarnemingen nodig.
Niet alle versies van de CLT zijn gebaseerd op identieke distributie, en zelfs niet op onafhankelijkheid. De basale versies die aan studenten worden geleerd, doen dat vaak, maar er zijn versies die niet beide aannames maken, bijv. de [Lyapunov CLT] (http://en.wikipedia.org/wiki/Central_limit_theorem#Lyapunov_CLT) veronderstelt onafhankelijkheid, maar niet identieke distributies, en de onafhankelijkheidsvoorwaarde kan ook worden versoepeld, bijvoorbeeld [zie hier] (http: // en .wikipedia.org / wiki / Central_limit_theorem # CLT_under_weak_dependence). Dat 'herordenen' is ook niet hetzelfde als onafhankelijkheid. Sommige vormen van afhankelijkheid zijn niet afhankelijk van orde.
Een steekproefomvang van 50.000 is onvoldoende om de CLT goed genoeg te laten werken om een betrouwbaarheidsinterval te berekenen voor het gemiddelde van een lognormale verdeling.


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 2.0-licentie waaronder het wordt gedistribueerd.
Loading...