Το
Η Ενισχυτική Μάθηση (RL) έχει ένα σύστημα ανταμοιβών και τιμωριών. Η ενισχυτική μάθηση είναι ευρύτερη από την παρακολουθούμενη ή χωρίς επίβλεψη μάθηση για την επίτευξη ενός στόχου ή απλώς για να κερδίσεις από κίνητρα και κυρώσεις από την περιβαλλοντική επαφή.
Σε ποιους τύπους ανταμοιβών και τιμωριών δίνονται ως ανατροφοδότηση;
Το πρώτο είναι αξιολογική ανατροφοδότηση ως ενίσχυση, όπου οι ανταμοιβές και οι τιμωρίες χρησιμοποιούνται για τη διαμόρφωση της συμπεριφοράς των μαθητών μέσω μηχανισμών ενίσχυσης μάθησης.
Ποιοι είναι οι τύποι ανταμοιβής και τιμωρίας;
Τώρα ας συνδυάσουμε αυτούς τους τέσσερις όρους: θετική ενίσχυση, αρνητική ενίσχυση, θετική τιμωρία και αρνητική τιμωρία (Πίνακας 1). Κάτι προστίθεται για να αυξήσει την πιθανότητα μιας συμπεριφοράς. Προστίθεται κάτι για να μειωθεί η πιθανότητα μιας συμπεριφοράς.
Ποιος τύπος μάθησης βασίζεται στην προσέγγιση ανταμοιβής και τιμωρίας;
Εμμέσως, χωρίς συνειδητή επεξεργασία, τα άτομα μαθαίνουν για την αξία ανταμοιβής και τιμωρίας κάθε πλαισίου και δραστηριότητας. Αυτές οι διαδικασίες συνειρμικής μάθησης, με τη σειρά τους, επηρεάζουν την πιθανότητα τα άτομα να ξαναεμπλακούν σε τέτοιες δραστηριότητες ή να αναζητήσουν αυτό το πλαίσιο.
Πώς επηρεάζουν τη μάθηση η ανταμοιβή και η τιμωρία;
Συνολικά, είδαμε μικρή επίδραση της ανταμοιβής είτε στη μάθηση είτε στη διατήρηση. Η τιμωρία δεν είχε καμία επίδραση στη διατήρηση των δεξιοτήτων, αλλά είχε σημαντική,επιδράσεις που εξαρτώνται από την εργασία στη μάθηση. Στην τιμωρία SRTT βελτιωμένη ταχύτητα με ελάχιστη επίδραση στην ακρίβεια. Αντίθετα, η τιμωρία μείωσε την απόδοση στον FTT.