Survival Analysis
Analyse der Zeit bis zum Eintreten eines Ereignisses
Was ist Überlebensanalyse?
Die Überlebensanalyse (Survival Analysis) ist eine statistische Methode zur Analyse der Zeit bis zu einem bestimmten Ereignis eintritt. Trotz des Namens beschränkt sie sich nicht nur auf medizinische Studien - sie wird auch in der Geschäftswelt häufig eingesetzt!
Sie liefern Daten darüber, wann die Ereignisse stattgefunden haben (oder ob sie noch nicht stattgefunden haben), und das System berechnet Überlebenswahrscheinlichkeiten, die durchschnittliche Zeit bis zum Ereignis und vergleicht verschiedene Gruppen.
Anwendungsbeispiele:
- • Vorhersagen, wann Kunden ihr Abonnement kündigen (Churn)
- • Analyse der Zeit bis zum Ausfall von Industriegeräten
- • Lifetime Value von Kunden schätzen
- • Vergleichen Sie die Wirksamkeit von medizinischen Behandlungen oder Interventionen
Schnellstart
- 1. Bereiten Sie Ihre Daten im CSV-Format mit Zeit, Ereignisstatus und Gruppe (optional) vor.
- 2. Laden Sie die Datei in die Upload-Seite
- 3. Konfigurieren Sie die Parameter (Modell, Variablen)
- 4. Warten Sie auf die Verarbeitung (normalerweise 2-4 Minuten)
- 5. Analysiere Überlebenskurven und Statistiken
Wie man seine Daten organisiert
Organisieren Sie Ihre Daten in einer CSV-Tabelle mit mindestens drei Spalten:
Spalte 1: Zeit (Dauer)
Wie viel Zeit bis zum Ereignis oder bis zur Zensur. Zum Beispiel: 120 Tage, 8 Monate, 3 Jahre
Spalte 2: Ereignis Eingetreten (Event)
1 wenn das Ereignis eingetreten ist (z.B.: Kunde hat gekündigt), 0 wenn es noch nicht eingetreten ist (zensiert)
Spalte 3+: Gruppe/Kovariablen (optional)
Merkmale zum Vergleichen von Gruppen. Zum Beispiel: Plan (Basis/Premium), Region, Alter
Beispiel für eine Kunden-Churn-Tabelle:
| duration_days | churned | plan |
|---|---|---|
| 365 | 1 | basic |
| 180 | 0 | premium |
| 90 | 1 | basic |
| 540 | 0 | premium |
💡 Zensur: Wenn churned=0, bedeutet das, dass der Kunde BIS ZU DIESEM MOMENT NOCH NICHT gekündigt hat. Das ist wichtig und die Überlebensanalyse kann damit umgehen!
Analyeinstellungen
Überlebensmodell
Wählen Sie die Analysemethode:
Zeitvariable
Name der Spalte, die die beobachtete Zeit enthält.
Beispiel:
duration_days, time_to_event, months
Ereignisvariable
Spaltenname, der angibt, ob das Ereignis aufgetreten ist (1) oder nicht (0).
Beispiel:
churned, event_occurred, died
Gruppenvariable (optional)
Spaltenname zum Vergleichen von Überlebenskurven zwischen Gruppen.
Beispiel:
plan, treatment, region
Verstehen der Ergebnisse
Die Analyse gibt Überlebenskurven und Statistiken zurück, die die Wahrscheinlichkeit zeigen, im Laufe der Zeit 'zu überleben' (das Ereignis nicht zu haben).
Überlebenskurve (Kaplan-Meier)
Y-Achse: Überlebenswahrscheinlichkeit
Varriert von 0 bis 1 (0% bis 100%). Zeigt, dass % das Ereignis noch nicht hatte.
Beispiel: 0,7 nach 180 Tagen = 70 % der Kunden sind noch aktiv
Achse X: Zeit
Zeitachse in Tagen, Monaten oder Jahren.
Die Kurve sinkt stufenweise, wenn Ereignisse auftreten.
Median Survival Time
Zeit bis 50% das Ereignis eintritt.
Beispiel: Median von 240 Tagen = die Hälfte der Kunden kündigt nach 8 Monaten
Log-Rank-Test (Gruppenvergleich)
Teste, ob die Kurven verschiedener Gruppen statistisch unterschiedlich sind.
p < 0.05 = Gruppen haben signifikant unterschiedliche Überlebensraten
⚠️ Praktische Interpretation: Wenn die 'premium'-Gruppe immer über der 'basic'-Kurve liegt, bedeutet das, dass Premium-Kunden länger überleben (geringere Abwanderung). Nutze dies, um strategische Entscheidungen zu treffen!
Brauchen Sie Hilfe? Kontakt aufnehmen: contato@grabatus.com