Survival Analysis

Analyse du temps jusqu'à l'événement se produise

Qu'est-ce que l'Analyse de Survie ?

L'Analyse de Survie (Survival Analysis) est une méthode statistique pour analyser le temps jusqu'à ce qu'un événement spécifique se produise. Malgré son nom, elle ne se limite pas aux études médicales - elle est largement utilisée dans les affaires !

Vous fournissez des données sur le moment où les événements se sont produits (ou s'ils ne se sont pas encore produits) et le système calcule les probabilités de survie, le temps moyen jusqu'à l'événement et compare différents groupes.

Exemples d'utilisation :

  • • Prévoir quand les clients vont annuler leur abonnement (churn)
  • • Analyser le temps jusqu'à la casse des équipements industriels
  • • Estimer la valeur à vie des clients
  • • Comparer l'efficacité des traitements médicaux ou des interventions

Démarrage Rapide

  1. 1. Préparez vos données au format CSV avec le temps, le statut de l'événement et le groupe (optionnel)
  2. 2. Téléchargez le fichier sur le page de téléchargement
  3. 3. Configurez les paramètres (modèle, variables)
  4. 4. Veuillez patienter pendant le traitement (généralement 2-4 minutes)
  5. 5. Analysez les courbes de survie et les statistiques

Comment organiser vos données

Organisez vos données dans un fichier CSV avec au moins trois colonnes :

Colonne 1 : Temps (Duration)

Combien de temps jusqu'à l'événement ou jusqu'à la censure. Par exemple : 120 jours, 8 mois, 3 ans.

Colonne 2 : Événement Survenu (Event)

1 si l'événement s'est produit (ex : le client a annulé), 0 s'il ne s'est pas encore produit (censuré)

Colonne 3+: Groupe/Covariables (optionnel)

Caractéristiques pour comparer des groupes. Par exemple : plan (de base/premium), région, âge

Exemple de feuille de calcul sur le churn des clients :

duration_days churned plan
365 1 basic
180 0 premium
90 1 basic
540 0 premium

💡 Censure : Lorsque churned=0, cela signifie que le client N'A PAS encore annulé jusqu'à ce moment-là. C'est important et l'analyse de survie sait comment gérer cela !

Paramètres de l'analyse

Modèle de Survivabilité

Choisissez la méthode d'analyse :

Kaplan-Meier Estimateur non paramétrique (standard, le plus courant)
Cox Modèle de risques proportionnels (avancé)

Variable de Temps

Nom de la colonne contenant le temps observé.

Exemple :

duration_days, time_to_event, months

Variable d'Événement

Nom de la colonne qui indique si l'événement s'est produit (1) ou non (0).

Exemple :

churned, event_occurred, died

Variable de Groupe (facultatif)

Nom de la colonne pour comparer les courbes de survie entre les groupes.

Exemple :

plan, treatment, region

Comprendre les résultats

L'analyse renvoie des courbes de survie et des statistiques qui montrent la probabilité de 'surviver' (ne pas avoir l'événement) au fil du temps.

Courbe de Survie (Kaplan-Meier)

Axe Y : Probabilité de Survie

Varie de 0 à 1 (0% à 100%). Montre que % n'a pas encore eu l'événement.

Exemple : 0,7 à 180 jours = 70 % des clients encore actifs

Axe X : Temps

Chronologie en jours, mois ou années.

La courbe descend en marches lorsque des événements se produisent.

Temps Médian de Survie

Temps jusqu'à 50% d'avoir l'événement.

Exemple : Médiane de 240 jours = la moitié des clients annulent en 8 mois

Log-Rank Test (comparaison de groupes)

Testez si les courbes de différents groupes sont statistiquement différentes.

p < 0,05 = Les groupes ont une survie significativement différente

⚠️ Interprétation pratique : Si le groupe 'premium' a toujours une courbe au-dessus de celle du 'basic', cela signifie que les clients premium survivent plus longtemps (taux de churn plus faible). Utilisez cela pour prendre des décisions stratégiques !

Besoin d'aide ? Contactez-nous : contato@grabatus.com