Survival Analysis

Análisis de tiempo hasta que ocurra un evento

¿Qué es el Análisis de Supervivencia?

El Análisis de Sobrevivencia (Survival Analysis) es un método estadístico para analizar el tiempo hasta que ocurre un evento específico. A pesar del nombre, no se limita a estudios médicos: ¡se utiliza ampliamente en negocios!

Usted proporciona datos sobre cuándo ocurrieron los eventos (o si aún no han ocurrido) y el sistema calcula probabilidades de supervivencia, tiempo promedio hasta el evento y compara diferentes grupos.

Ejemplos de uso:

  • • Predecir cuándo los clientes van a cancelar su suscripción (churn)
  • • Analizar el tiempo hasta la ruptura de equipos industriales
  • • Estimar el lifetime value de clientes
  • • Comparar la eficacia de tratamientos médicos o intervenciones

Inicio Rápido

  1. 1. Prepara tus datos en formato CSV con tiempo, estado del evento y grupo (opcional)
  2. 2. Sube el archivo en la página de carga
  3. 3. Configura los parámetros (modelo, variables)
  4. 4. Espere el procesamiento (normalmente 2-4 minutos)
  5. 5. Analice curvas de supervivencia y estadísticas

Cómo organizar tus datos

Organiza tus datos en una hoja de cálculo CSV con al menos tres columnas:

Columna 1: Tiempo (Duration)

¿Cuánto tiempo hasta el evento o hasta la censura? Por ejemplo: 120 días, 8 meses, 3 años.

Columna 2: Evento Ocurrió (Event)

1 si el evento ocurrió (p. ej.: cliente canceló), 0 si no ocurrió aún (censurado)

Columna 3+: Grupo/Covariables (opcional)

Características para comparar grupos. Por ejemplo: plan (básico/premium), región, edad

Ejemplo de hoja de cálculo de churn de clientes:

duration_days churned plan
365 1 basic
180 0 premium
90 1 basic
540 0 premium

💡 Censura: Cuando churned=0, significa que el cliente AÚN NO ha cancelado hasta ese momento. ¡Esto es importante y el análisis de supervivencia sabe cómo manejarlo!

Configuraciones del análisis

Modelo de Supervivencia

Elige el método de análisis:

Kaplan-Meier Estimador no paramétrico (estándar, más común)
Cox Modelo de riesgos proporcionales (avanzado)

Variable de Tiempo

Nombre de la columna que contiene el tiempo observado.

Ejemplo:

duration_days, time_to_event, months

Variable de Evento

Nombre de la columna que indica si el evento ocurrió (1) o no (0).

Ejemplo:

churned, event_occurred, died

Variable de Grupo (opcional)

Nombre de la columna para comparar curvas de supervivencia entre grupos.

Ejemplo:

plan, treatment, region

Entendiendo los resultados

El análisis devuelve curvas de supervivencia y estadísticas que muestran la probabilidad de 'sobrevivir' (no tener el evento) a lo largo del tiempo.

Curva de Supervivencia (Kaplan-Meier)

Eje Y: Probabilidad de Supervivencia

Varía de 0 a 1 (0% a 100%). Muestra que % aún no ha tenido el evento.

Ejemplo: 0.7 a los 180 días = 70% de los clientes aún activos

Eje X: Tiempo

Línea de tiempo en días, meses o años.

La curva baja en escalones cuando ocurren eventos.

Tiempo Mediano de Supervivencia

Tiempo hasta el 50% de tener el evento.

Ejemplo: Mediana de 240 días = la mitad de los clientes cancela en 8 meses

Prueba de Log-Rank (comparación de grupos)

Prueba si las curvas de diferentes grupos son estadísticamente diferentes.

p < 0.05 = Grupos tienen una supervivencia significativamente diferente

⚠️ Interpretación práctica: Si el grupo 'premium' tiene una curva siempre por encima del 'basic', significa que los clientes premium sobreviven más (menor churn). ¡Utiliza esto para tomar decisiones estratégicas!

¿Necesitas ayuda? Póntete en contacto: contato@grabatus.com