Survival Analysis
Analisi del tempo fino al verificarsi di un evento
Che cos'è l'Analisi della Sopravvivenza?
L'Analisi di Sopravvivenza (Survival Analysis) è un metodo statistico per analizzare il tempo fino a quando si verifica un evento specifico. Nonostante il nome, non si limita a studi medici - è ampiamente utilizzata nel business!
Fornisci dati su quando si sono verificati gli eventi (o se non si sono ancora verificati) e il sistema calcola le probabilità di sopravvivenza, il tempo medio fino all'evento e confrona diversi gruppi.
Esempi di utilizzo:
- • Prevedere quando i clienti cancelleranno l'abbonamento (churn)
- • Analizzare il tempo fino alla rottura delle attrezzature industriali
- • Stimare il lifetime value dei clienti
- • Confrontare l'efficacia dei trattamenti medici o delle interventi
Inizio Veloce
- 1. Prepara i tuoi dati in formato CSV con tempo, stato dell'evento e gruppo (opzionale)
- 2. Carica il file su pagina di upload
- 3. Configura i parametri (modello, variabili)
- 4. Attendere l'elaborazione (di solito 2-4 minuti)
- 5. Analizza curve di sopravvivenza e statistiche
Come organizzare i tuoi dati
Organizza i tuoi dati in un foglio di calcolo CSV con almeno tre colonne:
Colonna 1: Tempo (Duration)
Quanto tempo fino all'evento o fino alla censura. Ad esempio: 120 giorni, 8 mesi, 3 anni
Colonna 2: Evento Si è Verificato (Event)
1 se l'evento è occorso (es: il cliente ha cancellato), 0 se non è ancora occorso (censurato)
Colonna 3+: Gruppo/Covariabili (opzionale)
Caratteristiche per confrontare gruppi. Ad esempio: piano (base/premium), regione, età
Esempio di foglio di calcolo del churn dei clienti:
| duration_days | churned | plan |
|---|---|---|
| 365 | 1 | basic |
| 180 | 0 | premium |
| 90 | 1 | basic |
| 540 | 0 | premium |
💡 Censura: Quando churned=0, significa che il cliente NON ha ancora cancellato fino a quel momento. Questo è importante e l'analisi di sopravvivenza sa come gestirlo!
Impostazioni dell'analisi
Modello di Sopravvivenza
Scegli il metodo di analisi:
Variabile di Tempo
Nome della colonna che contiene il tempo osservato.
Esempio:
duration_days, time_to_event, months
Evento Variabile
Nome della colonna che indica se l'evento è avvenuto (1) o meno (0).
Esempio:
churned, event_occurred, died
Variabile di Gruppo (opzionale)
Nome della colonna per confrontare le curve di sopravvivenza tra i gruppi.
Esempio:
plan, treatment, region
Comprendere i risultati
L'analisi restituisce curve di sopravvivenza e statistiche che mostrano la probabilità di 'sopravvivere' (non avere l'evento) nel tempo.
Curva di Sopravvivenza (Kaplan-Meier)
Eje Y: Probabilità di Sopravvivenza
Varia da 0 a 1 (0% a 100%). Mostra che % non ha ancora avuto l'evento.
Esempio: 0,7 a 180 giorni = 70% dei clienti ancora attivi
Asse X: Tempo
Timeline in days, months, or years.
La curva scende a gradini quando si verificano eventi.
Tempo Mediano di Sopravvivenza
Tempo fino al 50% per avere l'evento.
Esempio: Mediana di 240 giorni = metà dei clienti annulla in 8 mesi
Log-Rank Test (confronto tra gruppi)
Testa se le curve di diversi gruppi sono statisticamente diverse.
p < 0.05 = I gruppi hanno una sopravvivenza significativamente diversa
⚠️ Interpretazione pratica: Se il gruppo 'premium' ha sempre una curva sopra il 'basic', significa che i clienti premium sopravvivono di più (minore churn). Usa questo per prendere decisioni strategiche!
Hai bisogno di aiuto? Contattaci: contato@grabatus.com