Η Meta παρουσίασε πρόσφατα τη νέα σειρά μοντέλων τεχνητής νοημοσύνης Llama 4, που αναμένεται να επηρεάσει δραστικά τον τομέα της τεχνολογίας.

Με δύο μοντέλα ήδη διαθέσιμα, το Llama 4 Scout και το Llama 4 Maverick, και το επερχόμενο Llama 4 Behemoth, η Meta κάνει ένα μεγάλο βήμα προς την εξάλειψη των περιορισμών που αντιμετωπίζουν οι προηγούμενοι αλγόριθμοι. Το Llama 4 ενσωματώνει καινοτόμες τεχνολογίες και μια αρχιτεκτονική που υπόσχεται να ανατρέψει τις ισχύουσες τάσεις της αγοράς, προσφέροντας νέες δυνατότητες σε τομείς όπως η κωδικοποίηση και ο συλλογισμός, με εξαιρετικά αποτελέσματα και χαμηλή κατανάλωση πόρων.

Η νεότερη συλλογή μοντέλων τεχνητής νοημοσύνης τροφοδοτούν πλέον τον βοηθό Meta AI στο διαδίκτυο και στο WhatsApp, το Messenger και το Instagram. Τα δύο νέα μοντέλα, τα οποία είναι επίσης διαθέσιμα για λήψη από τη Meta ή το Hugging Face, είναι το Llama 4 Scout -ένα μικρό μοντέλο ικανό να «χωρέσει σε μία μόνο GPU Nvidia H100»- και το Llama 4 Maverick, το οποίο μοιάζει περισσότερο με το GPT-4o και το Gemini 2.0 Flash.

Η Meta λέει ότι βρίσκεται ακόμη στη διαδικασία εκπαίδευσης του Llama 4 Behemoth, το οποίο ο διευθύνων σύμβουλος της Meta Mark Zuckerberg λέει ότι είναι «το βασικό μοντέλο με τις υψηλότερες επιδόσεις στον κόσμο».

Υπολογιστής με τεχνητή νοημοσύνη

Σύμφωνα με τη Meta, το Llama 4 Scout έχει ένα παράθυρο συμφραζομένων 10 εκατομμυρίων συμβόλων -τη μνήμη εργασίας ενός μοντέλου τεχνητής νοημοσύνης– και κερδίζει τα μοντέλα Gemma 3 και Gemini 2.0 Flash-Lite της Google, καθώς και το ανοιχτού κώδικα Mistral 3.1, «σε ένα ευρύ φάσμα ευρέως αναφερόμενων συγκριτικών μετρήσεων», ενώ εξακολουθεί να «χωράει σε μία μόνο GPU Nvidia H100».

Η Meta κάνει παρόμοιους ισχυρισμούς για τις επιδόσεις του μεγαλύτερου μοντέλου Maverick σε σχέση με το GPT-4o της OpenAI και το Gemini 2.0 Flash της Google και λέει ότι τα αποτελέσματά της είναι συγκρίσιμα με το DeepSeek-V3 σε εργασίες κωδικοποίησης και συλλογισμού χρησιμοποιώντας «λιγότερες από τις μισές ενεργές παραμέτρους».

Όπως αναφέρει το The Verge, το Llama 4 Behemoth έχει 288 δισεκατομμύρια ενεργές παραμέτρους με 2 τρισεκατομμύρια παραμέτρους συνολικά. Παρόλο που δεν έχει κυκλοφορήσει ακόμα, η Meta λέει ότι το Behemoth μπορεί να ξεπεράσει τους ανταγωνιστές του (στην προκειμένη περίπτωση το GPT-4.5 και το Claude Sonnet 3.7) «σε διάφορα STEM σημεία αναφοράς».

Για το Llama 4, η Meta λέει ότι μεταπήδησε σε μια αρχιτεκτονική «μίξης ειδικών» (MoE), μια προσέγγιση που εξοικονομεί πόρους χρησιμοποιώντας μόνο τα μέρη ενός μοντέλου που είναι απαραίτητα για μια συγκεκριμένη εργασία.

Όπως και με τα προηγούμενα μοντέλα της, η Meta αποκαλεί τη συλλογή Llama 4 «ανοικτού κώδικα», αν και το Llama έχει επικριθεί για τους περιορισμούς της άδειας χρήσης του. Για παράδειγμα, η άδεια χρήσης του Llama 4 απαιτεί από εμπορικές οντότητες με περισσότερους από 700 εκατομμύρια μηνιαίους ενεργούς χρήστες να ζητούν άδεια από τη Meta πριν χρησιμοποιήσουν τα μοντέλα της, κάτι που, όπως έγραψε το 2023 η Πρωτοβουλία Ανοικτού Κώδικα, το βγάζει «από την κατηγορία του “Ανοικτού Κώδικα”».