785 Shares 8933 views

Regressione logistica: modelli e metodi

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. La regressione logistica e l'analisi discriminante sono utilizzati quando è necessario distinguere chiaramente intervistati categorie mirate. Inoltre, questi gruppi sono singoli livelli parametro univariati. а также выясним, для чего она нужна. Considerate ulteriore dettaglio modello di regressione logistica, così come scoprire che cosa è stato per.

Panoramica

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Un esempio del problema, nella soluzione che viene utilizzata la regressione logistica, può essere una classificazione dei rispondenti di gruppo d'acquisto e non comprare la senape. La differenziazione viene effettuata secondo le caratteristiche socio-demografiche. Tra questi, in particolare, comprendono l'età, il sesso, il numero dei membri della famiglia, reddito e così via. Ci sono dei criteri per differenziare e la variabile nell'operazione. Quest'ultimo codifica categoria target per cui, di fatto, necessario dividere rispondenti.

sfumature

, значительно уже, чем для дискриминантного анализа. Va detto che la gamma dei casi in cui la logistica di regressione applicate, molto più stretta della analisi discriminante. A questo proposito, l'uso di quest'ultimo come un metodo universale per la differenziazione è considerato più preferito. Inoltre, gli esperti raccomandano la partenza con uno studio classificazione L'analisi discriminante. E nel caso di incertezza per i risultati possono essere utilizzati regressione logistica. Questa necessità è causata da diversi fattori. используется при наличии четкого представления о типе независимых и зависимых переменных. regressione logistica viene utilizzata quando v'è una chiara idea sul tipo di variabili indipendenti e dipendenti. Di conseguenza, l'selezionata una delle 3 possibili procedure. Quando l'analisi discriminante, il ricercatore è sempre a che fare con un funzionamento statico. Ha coinvolto uno variabili categoriali indipendenti dipendenti e diversi con la scala di qualsiasi tipo.

tipi

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. ricerca statistica obiettivo, che utilizza una regressione logistica, è quello di determinare la probabilità che una determinata risposta verrà assegnato a un particolare gruppo. Differenziazione è effettuata secondo determinati parametri. In pratica, secondo i valori di uno o più fattori indipendenti possono essere classificati in due gruppi di rispondenti. . In questo caso, v'è una regressione logistica binaria. Anche parametri specificati possono essere adottati per l'assegnazione al gruppo è maggiore di due. In una tale situazione v'è una regressione logistica multinomiale. Il gruppo risultante espresso livelli di qualsivoglia variabile.

esempio

Supponiamo che ci siano le risposte degli intervistati alla domanda se sono interessati ad un'offerta per acquisire terreni nella periferia di Mosca. In questo caso, le opzioni sono "no" e "sì". Abbiamo bisogno di scoprire quali fattori hanno un'influenza predominante sulla decisione dei potenziali acquirenti. Per questo intervistato ci si interroga circa l'infrastrutturale del territorio, la distanza alla capitale, superficie, presenza / assenza di edifici residenziali e così via. Utilizzando la regressione binaria, può essere distribuito in due gruppi di intervistati. La prima comprenderà coloro che sono interessati all'acquisto – i potenziali acquirenti, e il secondo, rispettivamente, coloro che non sono interessati a tale offerta. Per ogni partecipante, in aggiunta, sarà calcolata la probabilità di assegnazione a una categoria o un altro.

caratteristiche comparative

A differenza delle due forme di realizzazione di cui sopra consiste in un numero e tipo di gruppi dipendenti e variabili indipendenti differente. In una regressione binario, per esempio, ha studiato il fattore dicotomica dipendenza da una o più condizioni indipendenti. In questo caso, questi ultimi possono essere di qualsiasi tipo di scala. regressione multinomiale è considerato una sorta di versione della classificazione. Si riferisce alla variabile dipendente per più di 2 gruppi. fattori indipendenti devono avere sia un ordinale o scala nominale.

Regressione logistica in SPSS

Il pacchetto 11-12 statistica, ha introdotto una nuova versione dell'analisi – sequenza. Questo metodo viene utilizzato quando fattore dipendente riguarda lo stesso nome della bilancia (ordinale). In questo caso le variabili indipendenti selezionate un tipo particolare. Essi devono essere o ordinale o nominale. Classificazione in diverse categorie è considerato il più versatile. Questo metodo può essere utilizzato in tutti gli studi che hanno usato la regressione logistica. , однако, можно только с помощью всех трех приемов. Migliorare la qualità del modello, però, è possibile solo utilizzando tutti e tre i metodi.

classificazione ordinale

Si dice che in precedenza nel pacchetto statistico non è stato fornito l'opportunità di eseguire un'analisi tipica specializzato per fattori dipendenti con una scala ordinale. Per tutte le variabili, con il numero di gruppi di più di 2 utilizzati opzione multinomiale. Introdotto relativamente recente analisi della sequenza ha una serie di caratteristiche. Essi prendono in considerazione le specificità della scala esso. часто не рассматривается как отдельный прием. Nel frattempo, nei manuali metodologici ordinale regressione logistica spesso non è trattato come una reception separata. La ragione è la seguente: analisi seriale non ha vantaggi significativi rispetto multinomial. Il ricercatore potrebbe utilizzare quest'ultimo in presenza e ordinale e nominale variabile dipendente. In tal modo, il processo di classificazione sono quasi indistinguibili gli uni dagli altri. Ciò significa che l'analisi dell'ordine azienda non causa alcun problema.

analisi delle opzioni

Si consideri il caso semplice – una regressione binaria. Ad esempio, nel processo di marketing di ricerca stimato domanda di laureati di certa università metropolitana. Nel questionario, è stato chiesto domande, tra cui:

  1. Stai lavorando? (Ql).
  2. Specificare la laurea anno (q 21).
  3. Qual è il punteggio medio della presa (Aver).
  4. Genere (Q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. regressione logistica valuterà l'impatto di fattori indipendenti Aver, q 21 e 22 q a ql variabile. In poche parole, lo scopo dell'analisi è quello di determinare la probabile occupazione dei laureati sulla base delle informazioni sul campo, alla fine dell'anno, e il punteggio medio.

Regressione logistica

Per impostare i parametri utilizzando la regressione binaria, utilizzare il menu Analyze►Regression►Binary Logistic. Nella regressione logistica di scegliere nella lista di sinistra delle variabili disponibili fattore dipendente. Si è ql. Questa variabile deve essere collocato nel campo Dipendente. Dopo di che, è necessario immettere le covariate del sito fattori indipendenti – q 21, q 22, Aver. Quindi è necessario scegliere un modo di includerli nell'analisi. Se il numero di fattori indipendenti di più di 2, non utilizzare il metodo di somministrazione simultanea di tutte le variabili, che viene installato per impostazione predefinita, e passo dopo passo. Il modo più popolare è considerata Backward: LR. Utilizzando il pulsante Select, non è possibile includere nello studio di tutti gli intervistati, e solo una specifica categoria di destinazione.

Definire variabili categoriali

Pulsante categorica da utilizzare nel caso in cui una delle variabili è valutato per il numero di categorie di più di 2. In questa situazione, definire la finestra variabili categoriali nella stazione covariate categoriche posta proprio come un'opzione. In questo esempio, tale variabile è mancante. Dopo tale elenco a discesa, selezionare l'elemento di contrasto Deviazione e fare clic sul pulsante Modifica. Di conseguenza, alcune delle variabili dipendenti saranno generati da ciascuna del fattore nominale. Il loro numero corrisponde al numero delle condizioni iniziali delle categorie.

Salva nuove variabili

Utilizzare il pulsante Salva nello studio principale è impostato per creare la finestra di dialogo nuove impostazioni. Essi contengono numeri calcolati nel processo di regressione. In particolare, è possibile creare variabili che determinano:

  1. L'appartenenza ad una particolare categoria di classificazione (Groupmembership).
  2. La probabilità di classificazione intervistati in ciascun gruppo di studio (Probabilità).

Quando si utilizza il pulsante di ricercatore Opzioni non riceve nessuna opportunità significative. Di conseguenza, si può essere ignorato. Dopo aver premuto il tasto "OK" nella finestra principale viene visualizzato i risultati delle analisi.

Il controllo di qualità di adeguatezza regressione logistica

Si consideri la tabella Omnibus Testsof Girl coefficienti. Esso mostra i risultati dell'analisi della qualità del modello approssimazione. A causa del fatto che l'opzione incrementale, è necessario guardare i risultati dell'ultima fase (Fase 2) è stata impostata. Sarebbe considerato un risultato positivo, in cui l'incremento dell'indice rilevato Chi-quadro nella transizione alla fase successiva ad un alto grado di significatività (Sig. <0,05). La qualità del modello viene stimato in linea del modello. Se si ottiene un valore negativo, ma non è considerato come significativo se il modello complessivo alta materialità, l'ultimo può essere considerato praticamente utilizzabile.

tavoli

Sommario modello fornisce una stima di indice di dispersione totale, che descrive il modello costruito (figura R Square). Si consiglia di applicare il valore Nagelker. indicatore positivo può essere considerato come un parametro Nagelkerke R Square, se è superiore a 0,50. Dopo che valutati i risultati della classificazione in cui gli indicatori reali di appartenenza all'uno o all'altro categoria dello studio sono confrontati con quelli previsti dal modello di regressione. A questo scopo il Tavolo di classificazione. Esso permette inoltre di trarre conclusioni circa la correttezza di differenziazione per ogni del gruppo in questione. . La tabella seguente permette di trovare statisticamente significativi fattori indipendenti inseriti nell'analisi, nonché un fattore di non-standard di regressione logistica. Sulla base di questi indicatori in grado di prevedere appartenenza di ciascun intervistato nel campione a un gruppo specifico. Nuove variabili possono essere inseriti utilizzando il pulsante Salva. Essi conterranno informazioni sulla appartenenza ad una particolare categoria di classificazione (Predictedcategory) e la probabilità di inclusione in questi gruppi (appartenenza probabilità previste). Dopo aver premuto il tasto "OK" nella finestra principale apparirà logistica multinomiale Regressione risultati di calcolo.

La prima tabella, che contiene importanti indicatori per il ricercatore, – Modello Fitting informazioni. Un alto livello di significatività statistica punterà alla qualità e idoneità dell'uso di modelli per risolvere problemi pratici. Un altro tavolo importante è la Pseudo R-Square. Esso consente di stimare la proporzione della varianza totale nel fattore dipendente, che è causato dalle variabili indipendenti selezionate per l'analisi. Secondo la tabella di verosimiglianza test del rapporto può trarre conclusioni circa la significatività statistica di questi ultimi. Le stime dei parametri riflettono i coefficienti non standardizzati. Essi sono utilizzati nella costruzione dell'equazione. In aggiunta, per ogni combinazione di variabili è determinata la significatività statistica del loro impatto sul fattore dipendente. Nel frattempo, la ricerca di mercato è spesso necessario differenziare le categorie di intervistati non separatamente, ma come parte del gruppo target. A tal fine il tavolo Observedand Frequenze previsto.

applicazione pratica

metodo ritenuto di analisi è ampiamente usato nel lavoro degli operatori. Nel 1991, l'indicatore sigma regressione logistica è stato sviluppato. Egli è uno strumento facile da usare ed efficace che può essere utilizzato per prevedere i prezzi che possono loro "surriscaldamento". Indicatore viene presentato su un grafico a forma di un canale formato da due linee che si estendono in parallelo. Hanno rimosso una distanza uguale dalla tendenza. La larghezza del corridoio dipenderà esclusivamente i tempi. L'indicatore viene utilizzato quando si lavora con quasi tutta l'attività – da coppie di valute ai metalli preziosi.

In pratica, ha prodotto 2 strategie chiave per l'utilizzo dello strumento: composizione e un rovesciamento. In quest'ultimo caso l'operatore si concentrerà sulla dinamica delle variazioni dei prezzi all'interno del canale. Sul è la probabilità che il movimento si avvia nella direzione opposta come si avvicina il costo di un tasso linea di supporto o resistenza. Se il prezzo è strettamente in forma per il limite superiore, quindi l'attività può essere eliminato. Se è al limite inferiore, si dovrebbe pensare di acquistare. ripartizione strategia prevede l'utilizzo di warrant. Sono installati al di fuori dei limiti della distanza relativamente breve. Tenendo conto che il prezzo in alcuni casi li viola per un breve periodo di tempo, si dovrebbe giocare sul sicuro e impostare la stop-loss. Allo stesso tempo, naturalmente, indipendentemente dalla strategia scelta richiede il commerciante di massimizzare freddamente percepire e valutare la situazione che si è creata nel mercato.

conclusione

Pertanto, l'uso di regressione logistica permette a rapidamente e facilmente classificare gli intervistati in categorie in base ai parametri specificati. Quando si analizza il possibile uso di un certo modo. In particolare, la versatilità di diversa regressione multinomiale. Tuttavia, gli esperti consigliano l'uso di tutti i metodi sopra descritti nel complesso. Ciò è dovuto al fatto che in questo caso la qualità del modello sarà significativamente più alto. Questo, a sua volta, ampliare la gamma della sua applicazione.