Vraag:
Leg het verschil uit tussen meervoudige regressie en multivariate regressie, met minimaal gebruik van symbolen / wiskunde
Neil McGuigan
2010-09-03 23:54:17 UTC
view on stackexchange narkive permalink

Zijn meervoudige en multivariate regressie echt verschillend? Wat is is eigenlijk een variant?

Vijf antwoorden:
#1
+57
chl
2010-09-04 00:03:08 UTC
view on stackexchange narkive permalink

Heel snel zou ik zeggen: 'multiple' is van toepassing op het aantal voorspellers dat het model binnenkomt (of equivalent de ontwerpmatrix) met een enkele uitkomst (Y-respons), terwijl 'multivariate' verwijst naar een matrix van responsvectoren . Ik kan me de auteur niet herinneren die met die overweging zijn inleidende sectie over multivariate modellering begint, maar ik denk dat het Brian Everitt is in zijn leerboek An R and S-Plus Companion to Multivariate Analysis. Voor een grondige discussie hierover, zou ik willen voorstellen om naar zijn nieuwste boek te kijken, Multivariabele modellering en multivariate analyse voor de gedragswetenschappen.

Voor 'variate' zou ik dit willen zeggen is een gebruikelijke manier om te verwijzen naar een willekeurige variabele die een bekende of hypothetische verdeling volgt, bijv we spreken van gaussische variaties $ X_i $ als een reeks waarnemingen die zijn ontleend aan een normale verdeling (met parameters $ \ mu $ en $ \ sigma ^ 2 $). In probabilistische termen zeiden we dat dit enkele willekeurige realisaties van X zijn, met wiskundige verwachting $ \ mu $, en dat ongeveer 95% daarvan naar verwachting in het bereik $ [\ mu-2 \ ligt. sigma; \ mu + 2 \ sigma] $.

Zelfs https://www.coursera.org/learn/machine-learning/home/week/2 gebruikt de term multivariate regressie in plaats van multiple regressie ...
Ik denk dat dezelfde verwarring ontstaat bij mensen die de term GLM gebruiken voor algemeen lineair model (bijv. In neuroimaging-onderzoeken) versus gegeneraliseerd lineair model.Ik heb veel gevallen gezien van "multivariate logistische regressie" waarbij er maar één uitkomst is, en ik denk niet dat dit er zo veel toe doet, zolang de term maar duidelijk wordt gedefinieerd door de auteur.
#2
+47
user28
2010-09-04 00:27:21 UTC
view on stackexchange narkive permalink

Hier zijn twee nauw verwante voorbeelden die de ideeën illustreren. De voorbeelden zijn enigszins op de VS gericht, maar de ideeën kunnen worden geëxtrapoleerd naar andere landen.

Voorbeeld 1

Stel dat een universiteit haar toelatingscriteria wil verfijnen zodat dat ze ‘betere’ studenten erkennen. Stel ook dat het Grade Point Average (GPA) van een student is wat de universiteit wil gebruiken als prestatiemaatstaf voor studenten. Ze hebben verschillende criteria in gedachten, zoals middelbare school GPA (HSGPA), SAT-scores (SAT), geslacht enz. En willen graag weten welke van deze criteria belangrijk is voor GPA.

Oplossing: Meervoudige regressie

In de bovenstaande context is er één afhankelijke variabele (GPA) en heb je meerdere onafhankelijke variabelen (HSGPA, SAT, Geslacht enz.). U wilt weten welke van de onafhankelijke variabelen goede voorspellers zijn voor uw afhankelijke variabele. U zou meervoudige regressie gebruiken om deze beoordeling te maken.

Voorbeeld 2

In plaats van de bovenstaande situatie, stel dat het toelatingsbureau de prestaties van studenten in de tijd wil volgen en wil bepalen welke van hun criteria de prestaties van studenten in de loop van de tijd stimuleert. Met andere woorden, ze hebben GPA-scores voor de vier jaar dat een leerling op school blijft (bijvoorbeeld GPA1, GPA2, GPA3, GPA4) en ze willen weten welke van de onafhankelijke variabelen de GPA-scores beter voorspellen op jaarbasis. jaarbasis. Het toelatingsbureau hoopt te ontdekken dat de dezelfde onafhankelijke variabelen de prestaties over alle vier de jaren voorspellen, zodat hun keuze van toelatingscriteria ervoor zorgt dat de prestaties van de studenten gedurende alle vier de jaren consistent hoog zijn.

Oplossing: multivariate regressie

In voorbeeld 2 hebben we meerdere afhankelijke variabelen (dwz GPA1, GPA2, GPA3, GPA4) en meerdere onafhankelijke variabelen. In zo'n situatie zou je multivariate regressie gebruiken.

Er is er altijd een die de vraag goed beantwoordt met voorbeelden :)
100% het beste antwoord dat u werkelijk kunt begrijpen
#3
+26
stackoverflowuser2010
2016-07-18 08:29:33 UTC
view on stackexchange narkive permalink

Eenvoudige regressie heeft betrekking op één afhankelijke variabele ($ y $) en één onafhankelijke variabele ($ x $): $ y = f (x) $

Meervoudige regressie (ook bekend als multivariabele regressie) heeft betrekking op één afhankelijke variabele en meerdere onafhankelijke variabelen: $ y = f (x_1, x_2, ..., x_n) $

Multivariate regressie heeft betrekking op meerdere afhankelijke variabelen en meerdere sterke> onafhankelijke variabelen: $ y_1, y_2, ..., y_m = f (x_1, x_2, ..., x_n) $. U kunt problemen tegenkomen wanneer zowel de afhankelijke als de onafhankelijke variabelen zijn gerangschikt als matrices van variabelen (bijv. $ Y_ {11}, y_ {12}, ... $ en $ x_ {11}, x_ {12}, ... $ ), dus de uitdrukking kan worden geschreven als $ Y = f (X) $, waarbij hoofdletters matrices aangeven.

Verder lezen:

Ik begrijp de definitie.Maar wat is het effect van het behandelen van een multivariate regressie als een systeem van uni-variate regressies?
@LKS: Dat wil je misschien in een volledig aparte vraag stellen.
https://stats.stackexchange.com/questions/254254/why-do-we-need-multivariate-regression-as-opposed-to-a-bunch-of-univariate-regr
Verwees het antwoord in de Quora naar deze pagina?: P.
#4
+4
thecity2
2017-03-04 03:44:58 UTC
view on stackexchange narkive permalink

Ik denk dat het belangrijkste inzicht (en onderscheidende factor) hier, afgezien van het aantal variabelen aan weerszijden van de vergelijking, is dat in het geval van multivariate regressie het doel is om gebruik te maken van het feit dat er (in het algemeen) een verband bestaat tussen responsvariabelen (of uitkomsten).In een medische proef kunnen voorspellers bijvoorbeeld gewicht, leeftijd en ras zijn, en uitkomstvariabelen zijn bloeddruk en cholesterol.We zouden in theorie twee "meervoudige regressiemodellen" kunnen creëren, een model waarbij de bloeddruk wordt verlaagd op basis van gewicht, leeftijd en ras, en een tweede model waarbij cholesterol wordt verlaagd op basis van diezelfde factoren.Als alternatief zouden we echter een enkel multivariaat regressiemodel kunnen maken dat zowel bloeddruk als cholesterol gelijktijdig voorspelt op basis van de drie voorspellende variabelen.Het idee is dat het multivariate regressiemodel misschien beter (meer voorspellend) is in de mate dat het meer kan leren van de correlatie tussen bloeddruk en cholesterol bij patiënten.

Geweldig punt.Ik vroeg me af of multivariate regressie kan worden gedaan met R. Met Manova ben ik in staat om multivariate ANOVA te doen, maar niet in staat om coëfficiënten zoals univariate regressie te krijgen.
#5
+1
Bhabesh Mahanta
2019-03-04 19:56:59 UTC
view on stackexchange narkive permalink

Bij multivariate regressie zijn er meer dan één afhankelijke variabele met verschillende varianties (of verdelingen).De voorspellende variabelen kunnen meer dan een of meerdere zijn.Het kan dus een meervoudige regressie zijn met een matrix van afhankelijke variabelen, i.e.meerdere varianties. Maar als we meervoudige regressie zeggen, bedoelen we slechts één afhankelijke variabele met een enkele verdeling of variantie.De voorspellende variabelen zijn meer dan één. Samenvattend verwijst meerdere naar meer dan één voorspellende variabelen, maar multivariate verwijst naar meer dan één afhankelijke variabelen.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 2.0-licentie waaronder het wordt gedistribueerd.
Loading...