Survival Analysis

Analisi del tempo fino al verificarsi di un evento

Che cos'è l'Analisi della Sopravvivenza?

L'Analisi di Sopravvivenza (Survival Analysis) è un metodo statistico per analizzare il tempo fino a quando si verifica un evento specifico. Nonostante il nome, non si limita a studi medici - è ampiamente utilizzata nel business!

Fornisci dati su quando si sono verificati gli eventi (o se non si sono ancora verificati) e il sistema calcola le probabilità di sopravvivenza, il tempo medio fino all'evento e confrona diversi gruppi.

Esempi di utilizzo:

  • • Prevedere quando i clienti cancelleranno l'abbonamento (churn)
  • • Analizzare il tempo fino alla rottura delle attrezzature industriali
  • • Stimare il lifetime value dei clienti
  • • Confrontare l'efficacia dei trattamenti medici o delle interventi

Inizio Veloce

  1. 1. Prepara i tuoi dati in formato CSV con tempo, stato dell'evento e gruppo (opzionale)
  2. 2. Carica il file su pagina di upload
  3. 3. Configura i parametri (modello, variabili)
  4. 4. Attendere l'elaborazione (di solito 2-4 minuti)
  5. 5. Analizza curve di sopravvivenza e statistiche

Come organizzare i tuoi dati

Organizza i tuoi dati in un foglio di calcolo CSV con almeno tre colonne:

Colonna 1: Tempo (Duration)

Quanto tempo fino all'evento o fino alla censura. Ad esempio: 120 giorni, 8 mesi, 3 anni

Colonna 2: Evento Si è Verificato (Event)

1 se l'evento è occorso (es: il cliente ha cancellato), 0 se non è ancora occorso (censurato)

Colonna 3+: Gruppo/Covariabili (opzionale)

Caratteristiche per confrontare gruppi. Ad esempio: piano (base/premium), regione, età

Esempio di foglio di calcolo del churn dei clienti:

duration_days churned plan
365 1 basic
180 0 premium
90 1 basic
540 0 premium

💡 Censura: Quando churned=0, significa che il cliente NON ha ancora cancellato fino a quel momento. Questo è importante e l'analisi di sopravvivenza sa come gestirlo!

Impostazioni dell'analisi

Modello di Sopravvivenza

Scegli il metodo di analisi:

Kaplan-Meier Stimatore non parametrico (standard, più comune)
Cox Modello di rischi proporzionali (avanzato)

Variabile di Tempo

Nome della colonna che contiene il tempo osservato.

Esempio:

duration_days, time_to_event, months

Evento Variabile

Nome della colonna che indica se l'evento è avvenuto (1) o meno (0).

Esempio:

churned, event_occurred, died

Variabile di Gruppo (opzionale)

Nome della colonna per confrontare le curve di sopravvivenza tra i gruppi.

Esempio:

plan, treatment, region

Comprendere i risultati

L'analisi restituisce curve di sopravvivenza e statistiche che mostrano la probabilità di 'sopravvivere' (non avere l'evento) nel tempo.

Curva di Sopravvivenza (Kaplan-Meier)

Eje Y: Probabilità di Sopravvivenza

Varia da 0 a 1 (0% a 100%). Mostra che % non ha ancora avuto l'evento.

Esempio: 0,7 a 180 giorni = 70% dei clienti ancora attivi

Asse X: Tempo

Timeline in days, months, or years.

La curva scende a gradini quando si verificano eventi.

Tempo Mediano di Sopravvivenza

Tempo fino al 50% per avere l'evento.

Esempio: Mediana di 240 giorni = metà dei clienti annulla in 8 mesi

Log-Rank Test (confronto tra gruppi)

Testa se le curve di diversi gruppi sono statisticamente diverse.

p < 0.05 = I gruppi hanno una sopravvivenza significativamente diversa

⚠️ Interpretazione pratica: Se il gruppo 'premium' ha sempre una curva sopra il 'basic', significa che i clienti premium sopravvivono di più (minore churn). Usa questo per prendere decisioni strategiche!

Hai bisogno di aiuto? Contattaci: contato@grabatus.com