Το MIT εγκαινιάζει μια νέα μέθοδο εμπνευσμένη για τη διδασκαλία νέων δεξιοτήτων σε ρομπότ

Νέα αρχιτεκτονική που μιμείται τη διαδικασία εκπαίδευσης μεγάλων γλωσσικών μοντέλων υπόσχεται μεγαλύτερη προσαρμοστικότητα και αποδοτικότητα

19·11·2024 20:42

Newsroom

Το MIT παρουσίασε ένα νέο μοντέλο για την εκπαίδευση ρομπότ. Αντί για το συνηθισμένο σύνολο εστιασμένων δεδομένων που χρησιμοποιούνται για τη διδασκαλία νέων καθηκόντων στα ρομπότ, η μέθοδος προχωράει σε μεγάλο βαθμό, μιμούμενη τους τεράστιους όγκους πληροφοριών που χρησιμοποιούνται για την εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLM).

Οι ερευνητές σημειώνουν ότι η εκμάθηση μίμησης -κατά την οποία ο πράκτορας μαθαίνει ακολουθώντας ένα άτομο που εκτελεί μια εργασία- μπορεί να αποτύχει όταν εισάγονται μικρές προκλήσεις. Αυτές θα μπορούσαν να είναι πράγματα όπως ο φωτισμός, ένα διαφορετικό περιβάλλον ή νέα εμπόδια. Σε αυτά τα σενάρια, τα ρομπότ απλά δεν έχουν αρκετά δεδομένα για να βασιστούν προκειμένου να προσαρμοστούν.

Σύμφωνα με το techcrunch.com, η ομάδα αναζήτησε μοντέλα όπως το GPT-4 για ένα είδος προσέγγισης δεδομένων ωμής βίας στην επίλυση προβλημάτων.

«Στον τομέα της γλώσσας, τα δεδομένα είναι όλα απλά προτάσεις», λέει ο Lirui Wang, επικεφαλής συγγραφέας της νέας δημοσίευσης. «Στη ρομποτική, δεδομένης όλης της ετερογένειας των δεδομένων, αν θέλετε να προ-εκπαιδεύσετε με παρόμοιο τρόπο, χρειαζόμαστε μια διαφορετική αρχιτεκτονική».

Η ομάδα εισήγαγε μια νέα αρχιτεκτονική που ονομάζεται Heterogeneous Pretrained Transformers (HPT), η οποία συγκεντρώνει πληροφορίες από διαφορετικούς αισθητήρες και διαφορετικά περιβάλλοντα. Στη συνέχεια χρησιμοποιήθηκε ένας μετασχηματιστής για να συγκεντρώσει τα δεδομένα σε μοντέλα εκπαίδευσης. Όσο μεγαλύτερος είναι ο μετασχηματιστής, τόσο καλύτερο είναι το αποτέλεσμα.

Στη συνέχεια, οι χρήστες εισάγουν τον σχεδιασμό του ρομπότ, τη διαμόρφωση και τη δουλειά που θέλουν να γίνει.

«Το όνειρό μας είναι να έχουμε έναν καθολικό εγκέφαλο ρομπότ που θα μπορείτε να κατεβάσετε και να χρησιμοποιήσετε για το ρομπότ σας χωρίς καμία απολύτως εκπαίδευση», δήλωσε ο αναπληρωτής καθηγητής του CMU David Held σχετικά με την έρευνα. «Ενώ βρισκόμαστε μόλις στα αρχικά στάδια, θα συνεχίσουμε να πιέζουμε σκληρά και ελπίζουμε ότι η κλιμάκωση θα οδηγήσει σε μια επανάσταση στις ρομποτικές πολιτικές, όπως έγινε με τα μεγάλα γλωσσικά μοντέλα».

Η έρευνα ιδρύθηκε, εν μέρει, από το Toyota Research Institute.