Formation, Videnskab

Logistiske regression: modeller og metoder

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. Der anvendes Logistisk regression og diskriminant analyse, når det er nødvendigt klart at differentiere respondenterne målgruppen. Desuden er disse grupper er en enkelt univariate parameterniveauer. а также выясним, для чего она нужна. Overvej nærmere logistisk regressionsmodel, samt finde ud af, hvad det var for.

oversigt

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Et eksempel på problemet, i opløsningen, som anvendes logistisk regression, kan være en klassificering af de adspurgte efter gruppe køb og ikke købe sennep. Differentieringen er udført ifølge socio-demografiske karakteristika. Disse omfatter især omfatter alder, køn, antal familiemedlemmer, indkomst og så videre. Der er kriterier for at differentiere og variablen i operationen. Sidstnævnte koder mål-kategori, som i virkeligheden brug for at dele respondenter.

nuancer

, значительно уже, чем для дискриминантного анализа. Det skal siges, at udvalget af tilfælde, hvor de anvendte regression logistik, meget smallere end diskriminant analyse. I denne henseende er anvendelse af sidstnævnte som en universel metode til differentiering betragtes som mere foretrukket. Desuden eksperter anbefaler at begynde med en klassificering undersøgelse diskriminerende analyse. Og bare i tilfælde af usikkerhed på resultaterne kan bruges logistisk regression. Denne nødvendighed skyldes flere faktorer. используется при наличии четкого представления о типе независимых и зависимых переменных. bruges Logistisk regression, når der er en klar idé om, hvilken type af uafhængige og afhængige variable. Følgelig den udvalgte af de 3 mulige procedurer. Når diskriminant analyse, er forskeren altid beskæftiger sig med en statisk drift. Det involverede en afhængige og flere uafhængige kategoriske variabler med omfanget af enhver type.

typer

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Formål statistisk forskning, som bruger en logistisk regression, er at bestemme sandsynligheden for, at en bestemt respondent vil blive tilknyttet til en bestemt gruppe. Differentiering udføres i henhold til visse parametre. I praksis kan i overensstemmelse med værdierne af en eller flere uafhængige faktorer klassificeres i to grupper af respondenter. . I dette tilfælde er der en binær logistisk regression. Også specificerede parametre kan anvendes i tildelingen til gruppen er større end to. I en sådan situation er der et multinomial logistisk regression. Den resulterende gruppe udtrykte niveauer af ethvert variabel.

eksempel

Antag at der er de adspurgtes svar på spørgsmålet om, hvorvidt de er interesseret i et tilbud om at erhverve jord i forstæderne til Moskva. I dette tilfælde, er mulighederne "nej" og "ja". Vi er nødt til at finde ud af, hvilke faktorer har en dominerende indflydelse på afgørelsen af potentielle købere. Til denne respondent spørgsmål bliver spurgt om infrastrukturen i området, afstanden til hovedstaden, areal, tilstedeværelse / fravær af boliger og så videre. Ved hjælp af binær regression, kan distribueres i to grupper af respondenter. Den første vil omfatte dem, der er interesseret i at købe - potentielle købere, og den anden, henholdsvis dem, der ikke er interesseret i et sådant tilbud. For hver respondent, desuden det vil blive beregnet sandsynligheden for tildeling til den ene eller anden kategori.

komparative karakteristika

I modsætning til de to udførelsesformer ovenfor består i et forskelligt antal og type af grupper afhængige og uafhængige variable. I et binært regression, f.eks studerede afhængighed dichotomous faktor fra en eller flere uafhængige forhold. I dette tilfælde kan den sidstnævnte være af enhver type af skalaen. Multinomial regression betragtes som en slags version af klassifikationen. Den vedrører den afhængige variabel i mere end 2 grupper. Uafhængige faktorer skal have enten et ordenstal eller nominelle skala.

Logistisk Regression i SPSS

Statistikpakken 11-12, indført en ny version af analysen - sekvens. Denne fremgangsmåde anvendes, når afhængig faktor vedrører samme navn (ordinal) skala. I dette tilfælde valgt uafhængige variable en bestemt type. De skal enten være ordenstal eller nominelt. Klassifikation i flere kategorier betragtes som den mest alsidige. Denne metode kan anvendes i alle undersøgelser, der anvendte logistisk regression. , однако, можно только с помощью всех трех приемов. Forbedre kvaliteten af modellen, er imidlertid kun muligt ved hjælp af alle tre metoder.

ordinal klassificering

Det siges, at tidligere i den statistiske pakke ikke blev givet mulighed for at udføre en typisk specialiseret analyse for afhængige faktorer med et ordenstal skala. For alle variabler, idet antallet af grupper på mere end 2 anvendes multinomial mulighed. Forelagt relativt nylig sekvensanalyse har en række funktioner. De tager hensyn til de særlige forhold i det omfang det. часто не рассматривается как отдельный прием. I mellemtiden, i de metodiske manualer ordinal logistisk regression er ofte ikke behandles som en separat modtagelse. Årsagen er som følger: seriel analyse har ikke nogen væsentlige fordele i forhold multinomial. Forskeren kan meget vel anvende sidstnævnte i nærvær og ordenstal, og nominel afhængige variabel. Dermed klassifikationsprocessen er næsten umulig at skelne fra hinanden. Det betyder, at beholdningen ordre analyse ikke vil forårsage nogen problemer.

analyse af muligheder

Betragt det simple tilfælde - en binær regression. For eksempel, i færd med at markedsføring forskning skønnede efterspørgsel efter kandidater af visse Metropolitan University. I spørgeskemaet blev respondenterne stillede spørgsmål, herunder:

Arbejder du? (Ql).
Angiv år eksamen (q 21).
Hvad er den gennemsnitlige score på udløbet (gnsn).
Køn (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Logistisk regression vil vurdere virkningerne af uafhængige faktorer gnsn, q 21 og q 22 med variabel ql. Kort sagt er formålet med analysen er at bestemme den sandsynlige ansættelse af kandidater på grundlag af oplysninger om området, i slutningen af året, og den gennemsnitlige score.

logistisk regression

For at indstille parametre ved hjælp af binær regression, bruge Analyze►Regression►Binary Logistic menuen. I Logistisk regression for at vælge i venstre liste over tilgængelige variabler afhængig faktor. De er ql. Denne variabel skal placeres i de afhængige felt. Efter dette, skal du indtaste webstedet Kovariater uafhængige faktorer - q 21, q 22, gnsn. Så skal du vælge en måde at inkludere dem i analysen. Hvis antallet af uafhængige faktorer af mere end 2, ikke anvende metoden med samtidig indgivelse af alle variablerne, der er installeret som standard, og trin for trin. Den mest populære måde anses Bagud: LR. Ved hjælp af knappen Vælg, kan du ikke medtage i studiet af alle respondenter, og kun et specifikt mål kategori.

Definer kategoriske variabler

Kategorisk knap for at bruge i det tilfælde, hvor en af de variabler er vurderet til antallet af kategorier af mere end 2. I denne situation, Definer kategoriske variabler vindue i Kategoriske Kovariater station placeret netop sådan en mulighed. I dette eksempel er en sådan variabel mangler. Efter at rullelisten, vælge punktet Contrast Afvigelse og klik på knappen Skift. Som et resultat, vil nogle af de afhængige variable genereres fra hver af den nominelle faktor. Deres antal svarer til antallet af de oprindelige kategorierne.

Gem nye variabler

Brug knappen Gem i hovedundersøgelsen er indstillet til at skabe nye indstillinger dialogboksen. De vil indeholde tal beregnet i færd med regression. Især er det muligt at skabe variabler, der bestemmer:

Tilhører en bestemt kategori af klassifikationen (Groupmembership).
Sandsynligheden for at klassificere respondenter i hver undersøgelsesgruppe (Sandsynligheder).

Ved brug af knappen Indstillinger forskeren ikke modtager nogen væsentlige muligheder. Det kan derfor blive ignoreret. Efter tryk på "OK" knappen i hovedvinduet vises analyseresultater.

Kvalitetskontrol af logistisk regression tilstrækkelighed

Overvej tabellen Omnibus Testsof Model koefficienter. Det viser resultaterne af analysen af kvaliteten af tilnærmelsen model. På grund af det faktum, at den trinvise indstilling, du har brug for at se resultaterne af den sidste etape (Trin 2) er blevet indstillet. Ville blive betragtet som et positivt resultat, hvor den påviste stigning Chi-square indeks i overgangen til næste trin ved en høj grad af signifikans (Sig. <0,05). Kvaliteten af modellen er estimeret i Model linje. Hvis du får en negativ værdi, men det er ikke betragtes som væsentlig, hvis den generelt høje væsentlighed model, kan det sidste betragtes praktisk anvendelige.

tabeller

Model Sammendrag tilvejebringer et estimat af den samlede dispersion indeks, som beskriver den beregnede model (figur R Square). Det anbefales at anvende værdien Nagelker. Positiv indikator kan betragtes som en parameter Nagelkerke R Square, hvis den er højere end 0,50. Derefter evalueret resultaterne af klassificeringen, hvor den faktiske indikatorer for tilhører den ene eller anden kategori af undersøgelsen sammenlignes med forudsagt af regressionsmodellen. Til dette formål bordet Klassifikation Tabel. Det giver dig også mulighed for at drage konklusioner om rigtigheden af differentiering for hver af den pågældende gruppe. . Nedenstående tabel giver mulighed for at finde statistisk signifikante uafhængige faktorer indgået i analysen, samt en ikke-standardiseret faktor logistisk regression. På grundlag af disse indikatorer kan forudsige tilhørsforhold for hver respondent i prøven til en bestemt gruppe. Nye variabler kan indtastes ved hjælp af knappen Gem. De vil indeholde oplysninger om tilhørsforhold til en særlig klassifikation kategori (Predictedcategory) og sandsynligheden for inklusion i disse grupper (Predicted sandsynligheder medlemskab). Efter tryk på "OK" knappen i hovedvinduet vises MULTINOMIAL Logistisk regression beregningsresultater.

Den første tabel, som indeholder vigtige indikatorer for forskeren, - Model Montering oplysninger. Et højt niveau af statistisk signifikans vil pege på den høje kvalitet og egnethed af brugen af modeller til at løse praktiske problemer. En anden vigtig tabel er Pseudo R-pladsen. Gør det muligt at estimere andelen af den samlede varians i den afhængige faktor, som er forårsaget af de uafhængige variable er udvalgt til analyse. Ifølge tabel likelihood ratio test kan drage konklusioner om den statistiske signifikans af sidstnævnte. Parameterestimaterne afspejle ikke-standardiserede koefficienter. De anvendes i konstruktionen af ligningen. Endvidere for hver kombination af variabler bestemmes den statistiske signifikans af deres indvirkning på den afhængige faktor. I mellemtiden, markedsundersøgelser er ofte nødvendigt at differentiere de kategorier af respondenterne ikke hver for sig, men som en del af målgruppen. Til dette formål, tabel Observedand Forventet frekvenser.

praktiske anvendelse

Betragtes analysemetode er meget udbredt i arbejdet af forhandlere. I 1991 blev den sigmoid logistisk regression indikator udviklet. Han er en nem at bruge og effektivt værktøj, der kan bruges til at forudsige de sandsynlige priser til deres "overophedning". Indikatoren præsenteres på en graf i form af en kanal dannet af to linier, der strækker parallelt. De fjernede en lige stor afstand fra tendensen. Bredden af korridoren vil udelukkende afhænge af tidsrammen. Indikatoren bruges, når der arbejdes med næsten al aktiv - fra valutapar til ædelmetaller.

I praksis er det producerede 2 vigtigste strategier for anvendelsen af instrumentet: opdeling og en vending. I sidstnævnte tilfælde den erhvervsdrivende vil fokusere på dynamikken i pris ændringer inden for kanalen. On er sandsynligheden for, at bevægelsen starter i den modsatte retning, som den nærmer sig prisen på en støtte eller modstand linje sats. Hvis prisen er nøje passer til den øvre grænse, da aktivet kan elimineres. Hvis det er på den nedre grænse, bør du tænke på at købe. Strategi opdeling involverer anvendelse af warrants. De er installeret uden for rammerne af den relativt korte afstand. Under hensyntagen til, at prisen i nogle tilfælde overtræder dem for en kort tid, bør du spille det sikkert og sætte stop-loss. Samtidig, selvfølgelig, uanset den valgte strategi kræver den erhvervsdrivende at maksimere køligt opfatte og vurdere situationen, der er opstået i markedet.

konklusion

Anvendelsen af logistisk regression kan du hurtigt og nemt kategorisere respondenterne i kategorier i overensstemmelse med de angivne parametre. Ved analyse den mulige anvendelse af en bestemt måde. Især alsidighed forskellig multinomial regression. Men eksperter anbefaler brug af alle de metoder, der er beskrevet ovenfor i komplekset. Dette skyldes det faktum, at kvaliteten af modellen i dette tilfælde vil være betydeligt højere. Dette vil igen, udvide rækken af dens anvendelse.

Formation, Videnskab

Logistiske regression: modeller og metoder

oversigt

nuancer

typer

eksempel

komparative karakteristika

Logistisk Regression i SPSS

ordinal klassificering

analyse af muligheder

logistisk regression

Definer kategoriske variabler

Gem nye variabler

Kvalitetskontrol af logistisk regression tilstrækkelighed

tabeller

praktiske anvendelse

konklusion

Similar articles

Formation

Formation

Formation

Formation

Formation

Formation

Trending Now

Formation

Sundhed

Computere

Traveling

Formation

Computere

Newest

Kunst og underholdning

Kunst og underholdning

Kunst og underholdning

Hjem og familie

Computere

Sundhed