Στο Bagging, κάθε μεμονωμένο δέντρο είναι ανεξάρτητο το ένα από το άλλο επειδή λαμβάνει υπόψη διαφορετικό υποσύνολο χαρακτηριστικών και δειγμάτων.
Τι είναι το bagging στο δέντρο αποφάσεων;
Το
Συγκέντρωση (Συγκέντρωση Bootstrap) χρησιμοποιείται όταν ο στόχος μας είναι να μειώσουμε τη διακύμανση ενός δέντρου αποφάσεων. Εδώ η ιδέα είναι να δημιουργηθούν πολλά υποσύνολα δεδομένων από δείγμα εκπαίδευσης που επιλέγονται τυχαία με αντικατάσταση. … Χρησιμοποιείται ο μέσος όρος όλων των προβλέψεων από διαφορετικά δέντρα, ο οποίος είναι πιο ισχυρός από ένα δέντρο απόφασης.
Γιατί η συσκευασία δημιουργεί συσχετισμένα δέντρα;
Όλα τα δέντρα μας σε σακούλες τείνουν να κάνουν τις ίδιες περικοπές επειδή έχουν όλα τα ίδια χαρακτηριστικά. Αυτό κάνει όλα αυτά τα δέντρα να μοιάζουν πολύ με αποτέλεσμα να αυξάνεται η συσχέτιση. Για να λύσουμε τη συσχέτιση δέντρων, επιτρέπουμε στο τυχαίο δάσος να επιλέξει τυχαία μόνο m προγνωστικούς παράγοντες κατά την εκτέλεση του διαχωρισμού.
Τι είναι τυχαίο δάσος σε σάκους;
Το Bagging είναι ένας αλγόριθμος συνόλου που προσαρμόζει πολλαπλά μοντέλα σε διαφορετικά υποσύνολα ενός συνόλου δεδομένων εκπαίδευσης και, στη συνέχεια, συνδυάζει τις προβλέψεις από όλα τα μοντέλα. Το τυχαίο δάσος είναι μια επέκταση του bagging που επιλέγει επίσης τυχαία υποσύνολα χαρακτηριστικών που χρησιμοποιούνται σε κάθε δείγμα δεδομένων.
Πώς λειτουργεί η σακούλα σε τυχαίο δάσος;
Ο αλγόριθμος τυχαίου δάσους είναι στην πραγματικότητα ένας αλγόριθμος τσάντας: επίσης εδώ, αντλούμε τυχαία δείγματα εκκίνησης από το σετ προπόνησής σας. Ωστόσο, εκτός από τα δείγματα bootstrap, εμείς επίσηςσχεδιάστε τυχαία υποσύνολα χαρακτηριστικών για την εκπαίδευση των μεμονωμένων δέντρων. στο σάκκο, παρέχουμε σε κάθε δέντρο το πλήρες σύνολο χαρακτηριστικών.