Logistička regresija: model i metode

Metode logističke regresije

i koriste se diskriminativna analiza kada je potrebno jasno razlikovati ispitanike prema ciljnim kategorijama. U ovom slučaju, same skupine predstavljaju razine pojedinačnog univarijantnog parametra. Razmotrimo u detalje model logističke regresije, i saznajte zašto je to potrebno.regresijski logistički

Opće informacije

Primjer problema u rješavanju kojih regresijski logistički, može biti klasifikacija ispitanika po skupinama koje kupuju i ne kupuju senf. Razlika se provodi u skladu sa socio-demografskim obilježjima. Među njima, osobito, uključuju dob, spol, broj rodbine, dohodak, itd. U operacijama postoje kriteriji diferencijacije i varijable. Potonja kodira ciljne kategorije, koje zapravo moraju razdvojiti ispitanike.

nijanse

Valja napomenuti da raspon slučajeva u kojima regresijski logistički, mnogo uži nego za diskriminativnu analizu. S tim u vezi, smatra se da je uporaba potonjeg kao univerzalna metoda diferencijacije poželjna. Štoviše, stručnjaci preporučuju početak klasifikacijskih istraživanja s diskriminativnom analizom A samo u slučaju neizvjesnosti za rezultate možemo koristiti logističku regresiju. Ta je potreba posljedica nekih čimbenika. Logistička regresija Koristi se kada postoji jasna ideja o vrsti nezavisnih i zavisnih varijabli. U skladu s tim, odabire se jedan od 3 moguća postupka. S diskriminativnom analizom, istraživač se uvijek bavi jednom statičkom operacijom. To uključuje jednu zavisnu i više nezavisnih kategorijskih varijabli s mjerilom bilo koje vrste.

vrste

Zadatak statističkih istraživanja, koji koristi regresijski logistički, je odrediti vjerojatnost da će određeni ispitanik biti dodijeljen određenoj skupini. Razlika se provodi prema određenim parametrima. U praksi, prema vrijednostima jednog ili više neovisnih čimbenika, moguće je razvrstati ispitanike u dvije skupine. U ovom slučaju, binarna logistička regresija. Također, navedeni parametri mogu se koristiti za dodjeljivanje grupama koje su više od dvije. U takvoj situaciji postoji multinomična logistička regresija. Dobivene skupine se izražavaju razinama jedne varijable. logistička regresija

primjer

Recimo da postoje odgovori ispitanika na pitanje jesu li zainteresirani za prijedlog za stjecanje zemljišta u predgrađu Moskve. Opcije su "ne" i "da". Potrebno je utvrditi koji čimbenici utječu na odluku potencijalnih kupaca. Za ovu ispitanik pitanja postavljaju o infrastrukturi na teritoriju, udaljenost do glavnog grada, površina zemljišta, prisutnosti / odsutnosti stambenih zgrada i tako dalje. Binarno regresije, mogu se distribuirati u dvije grupe ispitanika. Prvi će uključivati ​​one koji su zainteresirani za stjecanje - potencijalni kupci, a drugi, odnosno oni koji nisu zainteresirani za takav prijedlog. Osim toga, za svakog ispitanika će se izračunati vjerojatnost dodjele kategorije.

Usporedne značajke

Razlika od dvije varijante gore navedene sastoji se u različitom broju skupina i vrsti ovisnih i nezavisnih varijabli. Na binarnoj regresiji, na primjer, proučava se ovisnost dihotomnog čimbenika na jednom ili više nezavisnih uvjeta. Potonji mogu imati bilo koju vrstu skale. Multinomična regresija se smatra varijacijom ove klasifikacijske opcije. U njoj je zavisna varijabla prisutna više od 2 skupine. Neovisni čimbenici moraju imati redni broj ili nominalnu mjerilu.

Logistička regresija u spssu

U statističkom paketu 11-12, uvedena je nova verzija analize: sekvencijalna. Ova se metoda koristi u slučaju kada se ovisni faktor odnosi na istu (redniju) ljestvicu. U ovom slučaju, nezavisne varijable odabrane su od jedne specifične vrste. Moraju biti redni ili nominalni. Razvrstavanje po nekoliko kategorija smatra se najopsežnijim. Ova se metoda može koristiti u svim studijama u kojima logistička regresija. Poboljšati kvalitetu modela, Međutim, to je moguće samo uz pomoć svih triju tehnika. kontrola kvalitete adekvatnosti i logističke regresije

Ordinalna klasifikacija

Važno je napomenuti da ranije u statističkom paketu nije bilo tipične mogućnosti izvođenja specijalizirane analize za ovisne faktore s rednim brojem. Za sve varijable s brojem skupina veće od 2, korištena je multinomična varijanta. Uvedene su relativno nedavno, redovna analiza ima niz značajki. Oni uzimaju u obzir specifičnosti ljestvice. U međuvremenu u metodičkim priručnicima, redoslijed logistička regresija često se ne smatra zasebnim uređajem. To je zbog sljedećeg: redovna analiza nema značajne prednosti u odnosu na multinomi. Istraživač može dobro koristiti potonji ako postoji redna i nominalna zavisna varijabla. Istodobno, klasifikacijski procesi se međusobno ne razlikuju mnogo. To znači da provođenje redovne analize neće uzrokovati poteškoće.

Mogućnost analize

Razmislite o jednostavnom slučaju - binarnoj regresiji. Pretpostavimo da je u procesu marketinškog istraživanja procjena relevantnosti diplomiranih pojedinaca na određenom sveučilištu u glavnom gradu. U upitniku su ispitanici postavljeni pitanja, uključujući:

  1. Radite li? (Q).
  2. Navesti godinu završetka (q 21).
  3. Koja je prosječna ocjena (prosjek).
  4. Seks (q22).

Logistička regresija omogućit će nam da procijenimo učinak nezavisnih čimbenika u porastu, q 21 i q 22 na varijabli ql. Jednostavno rečeno, svrha analize je utvrditi vjerojatnu zaposlenost diplomanata na temelju informacija o polju, godini mature i prosječne ocjene. logistički sigmoidni regresijski pokazatelj

Logistička regresija



Za podešavanje parametara pomoću binarne regresije, koristite izbornik Analyze►Regression►Binary Logistic. U prozoru logističke regresije morate odabrati ovisni faktor u lijevom popisu dostupnih varijabli. On je ql. Ova se varijabla mora nalaziti u polju Zavod. Nakon toga, nezavisni čimbenici trebaju biti uvedeni na stranice Covariata - q 21, q 22, aver. Zatim morate odabrati način uključivanja u analizu. Ako je broj nezavisnih čimbenika veći od 2, tada se ne koristi metoda istovremenog unošenja svih varijabli, koja se po defaultu instalira, ali metodom korak po korak. Najpopularniji način smatra se Natrag: LR. Pomoću gumba Odabir ne možete uključiti sve ispitanike u studiju, već samo određenu ciljnu kategoriju.

Definirajte kategorijske varijable

Kategorijski gumb treba koristiti kada je jedna od nezavisnih varijabli nominalna, a broj kategorija veći od 2. U ovoj situaciji, u prozoru Definiranje kategorije varijabli, taj se parametar nalazi na odjeljku kategorskih kovarijatura. U ovom primjeru nema takve varijable. Nakon toga na padajućem popisu kontrasta odaberite Odstupanje i pritisnite gumb Promijeni. Kao rezultat toga, iz svake nominalnog faktora formirat će se nekoliko zavisnih varijabli. Njihov broj odgovara broju kategorija izvornog stanja.

Spremi nove varijable

Pomoću gumba Spremi izradite nove parametre u glavnom dijaloškom okviru za istraživanje. Oni će sadržavati pokazatelje izračunate u regresijskom procesu. Konkretno, možete stvoriti varijable koje definiraju:

  1. Pripadaju se određenoj kategoriji klasifikacije (Groupmemshy-bership).
  2. Vjerojatnost dodjeljivanja ispitanika u svaku studijsku skupinu (Probabilities).

Kada koristite gumb Opcije, istraživač ne prima nikakve značajne značajke. Prema tome, može se zanemariti. Nakon što kliknete gumb "OK", rezultati analize bit će prikazani u glavnom prozoru. logistički regresijski koeficijent

Kontrola kvalitete adekvatnosti i logističke regresije

Razmotrite tablicu Omnibus Testsof Model Coefficients. Prikazuje rezultate analize kvalitete približavanja modelu. U vezi s činjenicom da je specificirana korak po korak, potrebno je pogledati rezultate posljednje faze (korak 2). Pozitivan rezultat će se uzeti u obzir tako da se povećanje pokazatelja Chi-kvadrata detektira pri prijelazu na sljedeću fazu s visokim stupnjem važnosti (Sig. < 0,05). Kvaliteta modela se procjenjuje u liniji Model. Ako se dobije negativna vrijednost, ali se ne smatra značajnom za opću veliku važnost modela, potonji se može smatrati praktički korisnim.

stolovi

Sažetak modela omogućuje procjenu indeksa agregatne varijancije koju opisuje konstruirani model (R Square pokazatelj). Preporuča se upotreba vrijednosti Nagelker. Pozitivan pokazatelj je parametar Nagelkerke R Square, ako je iznad 0,50. Nakon toga se procjenjuju rezultati klasifikacije u kojima se uspoređuju stvarni indeksi pripadnosti jednoj ili drugoj studiranoj kategoriji s onima predviđenim na temelju regresijskog modela. Da biste to učinili, upotrijebite tablicu klasifikacije. Također omogućuje izvući zaključke o ispravnosti diferencijacije za svaku grupu koja se razmatra. logistički regresijski model Sljedeća tablica pruža mogućnost da razjasni statističku značajnost neovisnih čimbenika uvedenih u analizu, kao i svaki ne-standardizirani logistički regresijski koeficijent. Na temelju tih pokazatelja moguće je predvidjeti pripadnost svakog ispitanika u uzorku određenoj skupini. Pomoću gumba Spremi možete unijeti nove varijable. Oni će sadržavati podatke o pripadnosti određenoj kategoriji klasifikacije (Preshy-dictedcategory) i vjerojatnost uključivanja u tim skupinama (Predviđeni vjerojatnosti članstva). Nakon što kliknete "OK", rezultati izračuna pojavljuju se u glavnom prozoru Multinomialne logističke regresije.

Prva tablica, u kojoj postoje važni pokazatelji za istraživača, je Model Fitting Information. Visoka razina statističke značajnosti pokazat će visoku kvalitetu i prikladnost korištenja modela u rješavanju praktičnih problema. Druga važna tablica je Pseudo R-Square. Omogućuje nam da procijenimo udio ukupne varijance u zavisnom faktoru koji određuju nezavisne varijable odabrane za analizu. Prema tablici Likelihood Ratio Testovi možete izvući zaključke o statističkoj značajnosti potonjeg. U procjenama parametara odražavaju se nestandardizirani koeficijenti. Koriste se za izradu jednadžbe. Osim toga, za svaku kombinaciju varijabli utvrđena je statistička značajnost njihovog učinka na ovisni faktor. U međuvremenu, u marketinškim istraživanjima, često se treba razlikovati prema kategoriji ispitanika, a ne pojedinačno, već kao dio ciljne skupine. Da biste to učinili, upotrijebite tablicu Observedand predvidjene frekvencije.

Praktična primjena

Ova metoda analize široko se koristi u radu trgovaca. Godine 1991. razvijen je pokazatelj logističke sigmoidne regresije. To je jednostavan za korištenje i učinkovit alat s kojim možete predvidjeti vjerojatne cijene prije nego što se "pregriju". Indikator je prikazan na grafikonu u obliku kanala koji čine dvije linije koje se paralelno izvode. Jednako su raspoređeni od trenda. Širina koridora ovisit će samo o vremenskom okviru. Indikator se koristi pri radu s gotovo svim sredstvima - od para valute do plemenitih metala.

logistička regresija u spss

U praksi su razrađene dvije ključne strategije za primjenu alata: na kvar i na skretanje. U potonjem slučaju, trgovac će biti vođen dinamikom promjene cijena unutar kanala. Budući da se trošak približava liniji potpore ili otpora, kladiti se na vjerojatnost pokretanja pokreta u suprotnom smjeru. Ako se cijena usko približi gornjoj granici, tada se imovina može prodati. Ako je na donjoj granici, onda je vrijedno razmišljati o stjecanju. Strategija kvara uključuje korištenje naloga. Oni su postavljeni izvan granica relativno male udaljenosti. Uzevši u obzir da se cijena u nekom slučaju prekrši kratko vrijeme, trebali biste biti ponovno osigurani i instalirali stop-loss. Istodobno, naravno, bez obzira na odabranu strategiju, trgovac mora biti svjež i hladan što je više moguće da percipira i procjenjuje situaciju koja se pojavila na tržištu.

zaključak

Dakle, korištenje logističke regresije omogućuje brzo i jednostavno klasificiranje ispitanika u kategorije u skladu s određenim parametrima. U analizi možete koristiti bilo koji način. Posebno, multinomična regresija je svestrana. Međutim, stručnjaci preporučuju korištenje svih gore navedenih metoda u kompleksu. To je zbog činjenice da će u ovom slučaju kvaliteta modela biti znatno veća. Ovo će zauzvrat proširiti opseg svoje primjene.

Dijelite na društvenim mrežama:

Povezan
Regresija u programu Excel: jednadžba, primjeri. Linearna regresijaRegresija u programu Excel: jednadžba, primjeri. Linearna regresija
Klaster analiza. Znanstveni pristup proučavanju složenih pojavaKlaster analiza. Znanstveni pristup proučavanju složenih pojava
Metode ekonomske analize poduzeća - teorijski aspektiMetode ekonomske analize poduzeća - teorijski aspekti
Korelacijska regresijska analiza i njegova široka primjena u gospodarstvuKorelacijska regresijska analiza i njegova široka primjena u gospodarstvu
Regresijsko ispitivanje softvera. Što je testiranje regresije?Regresijsko ispitivanje softvera. Što je testiranje regresije?
Logističke operacije: koncept, značajke, vrsteLogističke operacije: koncept, značajke, vrste
Metode matematičke statistike. Regresijska analizaMetode matematičke statistike. Regresijska analiza
Regresijska jednadžbaRegresijska jednadžba
Metoda najmanjih kvadrata u programu Excel. Regresijska analizaMetoda najmanjih kvadrata u programu Excel. Regresijska analiza
Metoda analize korelacije: primjer. Analiza korelacije je ...Metoda analize korelacije: primjer. Analiza korelacije je ...
» » Logistička regresija: model i metode
LiveInternet