Survival Analysis

Analyse der Zeit bis zum Eintreten eines Ereignisses

Was ist Überlebensanalyse?

Die Überlebensanalyse (Survival Analysis) ist eine statistische Methode zur Analyse der Zeit bis zu einem bestimmten Ereignis eintritt. Trotz des Namens beschränkt sie sich nicht nur auf medizinische Studien - sie wird auch in der Geschäftswelt häufig eingesetzt!

Sie liefern Daten darüber, wann die Ereignisse stattgefunden haben (oder ob sie noch nicht stattgefunden haben), und das System berechnet Überlebenswahrscheinlichkeiten, die durchschnittliche Zeit bis zum Ereignis und vergleicht verschiedene Gruppen.

Anwendungsbeispiele:

  • • Vorhersagen, wann Kunden ihr Abonnement kündigen (Churn)
  • • Analyse der Zeit bis zum Ausfall von Industriegeräten
  • • Lifetime Value von Kunden schätzen
  • • Vergleichen Sie die Wirksamkeit von medizinischen Behandlungen oder Interventionen

Schnellstart

  1. 1. Bereiten Sie Ihre Daten im CSV-Format mit Zeit, Ereignisstatus und Gruppe (optional) vor.
  2. 2. Laden Sie die Datei in die Upload-Seite
  3. 3. Konfigurieren Sie die Parameter (Modell, Variablen)
  4. 4. Warten Sie auf die Verarbeitung (normalerweise 2-4 Minuten)
  5. 5. Analysiere Überlebenskurven und Statistiken

Wie man seine Daten organisiert

Organisieren Sie Ihre Daten in einer CSV-Tabelle mit mindestens drei Spalten:

Spalte 1: Zeit (Dauer)

Wie viel Zeit bis zum Ereignis oder bis zur Zensur. Zum Beispiel: 120 Tage, 8 Monate, 3 Jahre

Spalte 2: Ereignis Eingetreten (Event)

1 wenn das Ereignis eingetreten ist (z.B.: Kunde hat gekündigt), 0 wenn es noch nicht eingetreten ist (zensiert)

Spalte 3+: Gruppe/Kovariablen (optional)

Merkmale zum Vergleichen von Gruppen. Zum Beispiel: Plan (Basis/Premium), Region, Alter

Beispiel für eine Kunden-Churn-Tabelle:

duration_days churned plan
365 1 basic
180 0 premium
90 1 basic
540 0 premium

💡 Zensur: Wenn churned=0, bedeutet das, dass der Kunde BIS ZU DIESEM MOMENT NOCH NICHT gekündigt hat. Das ist wichtig und die Überlebensanalyse kann damit umgehen!

Analyeinstellungen

Überlebensmodell

Wählen Sie die Analysemethode:

Kaplan-Meier Nichtparametrischer Schätzer (Standard, am häufigsten)
Cox Proportionales Risiko-Modell (fortgeschritten)

Zeitvariable

Name der Spalte, die die beobachtete Zeit enthält.

Beispiel:

duration_days, time_to_event, months

Ereignisvariable

Spaltenname, der angibt, ob das Ereignis aufgetreten ist (1) oder nicht (0).

Beispiel:

churned, event_occurred, died

Gruppenvariable (optional)

Spaltenname zum Vergleichen von Überlebenskurven zwischen Gruppen.

Beispiel:

plan, treatment, region

Verstehen der Ergebnisse

Die Analyse gibt Überlebenskurven und Statistiken zurück, die die Wahrscheinlichkeit zeigen, im Laufe der Zeit 'zu überleben' (das Ereignis nicht zu haben).

Überlebenskurve (Kaplan-Meier)

Y-Achse: Überlebenswahrscheinlichkeit

Varriert von 0 bis 1 (0% bis 100%). Zeigt, dass % das Ereignis noch nicht hatte.

Beispiel: 0,7 nach 180 Tagen = 70 % der Kunden sind noch aktiv

Achse X: Zeit

Zeitachse in Tagen, Monaten oder Jahren.

Die Kurve sinkt stufenweise, wenn Ereignisse auftreten.

Median Survival Time

Zeit bis 50% das Ereignis eintritt.

Beispiel: Median von 240 Tagen = die Hälfte der Kunden kündigt nach 8 Monaten

Log-Rank-Test (Gruppenvergleich)

Teste, ob die Kurven verschiedener Gruppen statistisch unterschiedlich sind.

p < 0.05 = Gruppen haben signifikant unterschiedliche Überlebensraten

⚠️ Praktische Interpretation: Wenn die 'premium'-Gruppe immer über der 'basic'-Kurve liegt, bedeutet das, dass Premium-Kunden länger überleben (geringere Abwanderung). Nutze dies, um strategische Entscheidungen zu treffen!

Brauchen Sie Hilfe? Kontakt aufnehmen: contato@grabatus.com