Survival Analysis
Ανάλυση χρόνου μέχρι να συμβεί ένα γεγονός
Τι είναι η Ανάλυση Επιβίωσης;
Η Ανάλυση Επιβίωσης (Survival Analysis) είναι μια στατιστική μέθοδος για να αναλύσει το χρόνο μέχρι να συμβεί ένα συγκεκριμένο γεγονός. Παρά το όνομά της, δεν περιορίζεται σε ιατρικές μελέτες - χρησιμοποιείται ευρέως στις επιχειρήσεις!
Παρέχετε δεδομένα σχετικά με το πότε συνέβησαν τα γεγονότα (ή αν δεν έχουν συμβεί ακόμη) και το σύστημα υπολογίζει πιθανότητες επιβίωσης, μέσο χρόνο μέχρι το γεγονός και συγκρίνει διαφορετικές ομάδες.
Χρήση παραδείγματα:
- • Προβλέψτε πότε οι πελάτες θα ακυρώσουν τη συνδρομή τους (churn)
- • Ανάλυση χρόνου μέχρι την αποτυχία βιομηχανικού εξοπλισμού
- • Εκτιμήστε την αξία ζωής των πελατών
- • Σύγκριση της αποτελεσματικότητας ιατρικών θεραπειών ή παρεμβάσεων
Γρήγορη Εκκίνηση
- 1. Ετοιμάστε τα δεδομένα σας σε μορφή CSV με χρόνο, κατάσταση συμβάντος και ομάδα (προαιρετικά)
- 2. Ανεβάστε το αρχείο στο σελίδα μεταφόρτωσης
- 3. Ρυθμίστε τις παραμέτρους (μοντέλο, μεταβλητές)
- 4. Παρακαλώ περιμένετε την επεξεργασία (κανονικά 2-4 λεπτά)
- 5. Αναλύστε καμπύλες επιβίωσης και στατιστικά
Πώς να οργανώσετε τα δεδομένα σας
Οργανώστε τα δεδομένα σας σε ένα αρχείο CSV με τουλάχιστον τρεις στήλες:
Στήλη 1: Χρόνος (Duration)
Πόσος χρόνος πριν από το γεγονός ή πριν από την λογοκρισία. Για παράδειγμα: 120 ημέρες, 8 μήνες, 3 χρόνια
Στήλη 2: Το γεγονός συνέβη (Event)
1 αν το γεγονός συνέβη (π.χ.: ο πελάτης ακύρωσε), 0 αν δεν συνέβη ακόμα (λογοκριμένο)
Στήλη 3+: Ομάδα/Συμπαραμετροί (προαιρετικά)
Χαρακτηριστικά για σύγκριση ομάδων. Για παράδειγμα: σχέδιο (βασικό/πριμ), περιοχή, ηλικία
Παράδειγμα πίνακα πελατών churn:
| duration_days | churned | plan |
|---|---|---|
| 365 | 1 | basic |
| 180 | 0 | premium |
| 90 | 1 | basic |
| 540 | 0 | premium |
💡 Λογοκρισία: Όταν το churned=0, σημαίνει ότι ο πελάτης ΔΕΝ έχει ακυρώσει μέχρι εκείνη τη στιγμή. Αυτό είναι σημαντικό και η ανάλυση επιβίωσης ξέρει πώς να το διαχειριστεί!
Ρυθμίσεις ανάλυσης
Μοντέλο Επιβίωσης
Επιλέξτε τη μέθοδο ανάλυσης:
Χρονική Μεταβλητή
Όνομα στήλης που περιέχει τον παρατηρούμενο χρόνο.
Παράδειγμα:
duration_days, time_to_event, months
Εκδηλωθείσα Μεταβλητή
Όνομα στήλης που υποδεικνύει αν το γεγονός συνέβη (1) ή όχι (0).
Παράδειγμα:
churned, event_occurred, died
Ομαδική Μεταβλητή (προαιρετική)
Όνομα στήλης για σύγκριση καμπυλών επιβίωσης μεταξύ ομάδων.
Παράδειγμα:
plan, treatment, region
Κατανοώντας τα αποτελέσματα
Η ανάλυση επιστρέφει καμπύλες επιβίωσης και στατιστικά που δείχνουν την πιθανότητα να 'επιβιώσετε' (να μην συμβεί το γεγονός) με την πάροδο του χρόνου.
Καμπύλη Επιβίωσης (Kaplan-Meier)
Άξονας Y: Πιθανότητα Επιβίωσης
Κυμαίνεται από 0 έως 1 (0% έως 100%). Δείχνει ότι % δεν έχει συμβεί ακόμα το γεγονός.
Παράδειγμα: 0,7 στους 180 ημέρες = 70% των πελατών εξακολουθούν να είναι ενεργοί
Άξονας X: Χρόνος
Χρονολόγιο σε ημέρες, μήνες ή χρόνια.
Η καμπύλη κατεβαίνει στα σκαλοπάτια όταν συμβαίνουν γεγονότα
Μέσος Χρόνος Επιβίωσης
Χρόνος μέχρι 50% να συμβεί το γεγονός.
Παράδειγμα: Μεσαία τιμή 240 ημερών = το ήμισυ των πελατών ακυρώνει σε 8 μήνες
Log-Rank Test (σύγκριση ομάδων)
Δοκιμάστε αν οι καμπύλες διαφορετικών ομάδων είναι στατιστικά διαφορετικές.
p < 0.05 = Οι ομάδες έχουν σημαντικά διαφορετική επιβίωση
⚠️ Πρακτική ερμηνεία: Εάν η ομάδα 'premium' έχει καμπύλη πάντα πάνω από την 'basic', σημαίνει ότι οι premium πελάτες επιβιώνουν περισσότερο (μικρότερο churn). Χρησιμοποιήστε το αυτό για να λαμβάνετε στρατηγικές αποφάσεις!
Χρειάζεστε βοήθεια; Επικοινωνήστε: contato@grabatus.com