Η Anthropic παρουσίασε το νέο μοντέλο τεχνητής νοημοσύνης Claude 3.7 Sonnet, το οποίο επιτρέπει στους χρήστες να καθορίζουν για πόσο χρονικό διάστημα το AI θα «σκεφτεί» πριν δώσει μια απάντηση.
Το Claude 3.7 Sonnet συνδυάζει την ικανότητα γρήγορων απαντήσεων με τη δυνατότητα πιο μελετημένων και ακριβών σκέψεων, ανοίγοντας νέους ορίζοντες στη λειτουργία των μοντέλων AI. Με αυτό το υβριδικό σύστημα, η Anthropic φιλοδοξεί να προσφέρει στους χρήστες μια πιο ευέλικτη και προσαρμόσιμη εμπειρία αλληλεπίδρασης με την τεχνητή νοημοσύνη.
Η Anthropic αποκαλεί το Claude 3.7 Sonnet το πρώτο «υβριδικό μοντέλο συλλογιστικής τεχνητής νοημοσύνης» της βιομηχανίας, επειδή πρόκειται για ένα ενιαίο μοντέλο που μπορεί να δώσει τόσο απαντήσεις σε πραγματικό χρόνο όσο και πιο «μελετημένες» απαντήσεις σε ερωτήσεις. Οι χρήστες μπορούν να επιλέξουν αν θα ενεργοποιήσουν τις ικανότητες «συλλογισμού» του μοντέλου AI, οι οποίες προτρέπουν το Claude 3.7 Sonnet να «σκεφτεί» για μικρό ή μεγάλο χρονικό διάστημα.
Το μοντέλο αντιπροσωπεύει την ευρύτερη προσπάθεια της Anthropic να απλοποιήσει την εμπειρία του χρήστη γύρω από τα προϊόντα τεχνητής νοημοσύνης της. Τα περισσότερα AI chatbots σήμερα διαθέτουν έναν τρομακτικό επιλογέα μοντέλων που αναγκάζει τους χρήστες να επιλέξουν μεταξύ πολλών διαφορετικών επιλογών που ποικίλλουν σε κόστος και δυνατότητες. Εργαστήρια όπως η Anthropic θα προτιμούσαν να μην χρειάζεται να το σκέφτεστε -ιδανικά, ένα μοντέλο κάνει όλη τη δουλειά.
Το Claude 3.7 Sonnet κυκλοφορεί σε όλους τους χρήστες και τους προγραμματιστές, αλλά μόνο όσοι πληρώνουν για τα premium πακέτα chatbot Claude της Anthropic θα έχουν πρόσβαση στα χαρακτηριστικά συλλογισμού του μοντέλου. Οι δωρεάν χρήστες του Claude θα λάβουν την τυπική, μη λογική έκδοση του Claude 3.7 Sonnet, η οποία, όπως ισχυρίζεται η Anthropic, ξεπερνά σε απόδοση το προηγούμενο μοντέλο της μεθοριακής τεχνητής νοημοσύνης, το Claude 3.5 Sonnet.
Το πρώτο μοντέλο ΤΝ της Anthropic που μπορεί να «σκεφτεί»

Το Claude 3.7 Sonnet είναι το πρώτο μοντέλο ΤΝ της Anthropic που μπορεί να «σκεφτεί», μια τεχνική στην οποία έχουν στραφεί πολλά εργαστήρια ΤΝ καθώς οι παραδοσιακές μέθοδοι βελτίωσης της απόδοσης της ΤΝ εξασθενούν.
Τα μοντέλα συλλογισμού όπως το o3-mini, το R1, το Gemini 2.0 Flash Thinking της Google και το Grok 3 (Think) της xAI χρησιμοποιούν περισσότερο χρόνο και υπολογιστική ισχύ πριν απαντήσουν σε ερωτήσεις. Τα μοντέλα αναλύουν τα προβλήματα σε μικρότερα βήματα, γεγονός που τείνει να βελτιώνει την ακρίβεια της τελικής απάντησης. Τα μοντέλα συλλογισμού δεν σκέφτονται ή συλλογίζονται απαραίτητα όπως θα έκανε ένας άνθρωπος, αλλά η διαδικασία τους διαμορφώνεται με βάση την αφαίρεση.
Τελικά, η Anthropic θα ήθελε το Claude να καταλάβει πόσο καιρό θα πρέπει να «σκέφτεται» για τις ερωτήσεις από μόνη του, χωρίς να χρειάζεται οι χρήστες να επιλέγουν ελέγχους εκ των προτέρων, δήλωσε στο TechCrunch σε συνέντευξή της η επικεφαλής προϊόντων και έρευνας της Anthropic, Dianne Penn.
«Παρόμοια με το πώς οι άνθρωποι δεν έχουν δύο ξεχωριστούς εγκεφάλους για τις ερωτήσεις που μπορούν να απαντηθούν άμεσα σε σχέση με εκείνες που απαιτούν σκέψη», έγραψε η Anthropic σε μια ανάρτηση στο blog που μοιράστηκε με το TechCrunch, «θεωρούμε τη συλλογιστική απλά ως μία από τις δυνατότητες που πρέπει να έχει ένα μοντέλο συνόρων, που πρέπει να ενσωματωθεί ομαλά με άλλες δυνατότητες, παρά ως κάτι που πρέπει να παρέχεται σε ένα ξεχωριστό μοντέλο».
Η Anthropic υποστηρίζει ότι βελτιστοποίησε τους τρόπους σκέψης του Claude για εργασίες του πραγματικού κόσμου, όπως δύσκολα προβλήματα κωδικοποίησης ή καθήκοντα πρακτόρων. Οι προγραμματιστές που αξιοποιούν το API της Anthropic μπορούν να ελέγχουν τον «προϋπολογισμό» της σκέψης, ανταλλάσσοντας την ταχύτητα και το κόστος με την ποιότητα της απάντησης.
Σε ένα τεστ για τη μέτρηση εργασιών κωδικοποίησης πραγματικών λέξεων, το Claude 3.7 Sonnet ήταν 62,3% ακριβές, σε σύγκριση με το μοντέλο o3-mini της OpenAI που σημείωσε 49,3%. Σε ένα άλλο τεστ για τη μέτρηση της ικανότητας ενός μοντέλου AI να αλληλεπιδρά με προσομοιωμένους χρήστες και εξωτερικά API σε περιβάλλον λιανικής πώλησης, το Claude 3.7 Sonnet σημείωσε 81,2%, σε σύγκριση με το μοντέλο o1 του OpenAI που σημείωσε 73,5%.
Το εργαλείο κωδικοποίησης της Anthropic
Εκτός από το Claude 3.7 Sonnet, η Anthropic κυκλοφορεί, επίσης, ένα εργαλείο κωδικοποίησης πρακτόρων που ονομάζεται Claude Code. Ξεκινώντας ως ερευνητική προεπισκόπηση, το εργαλείο επιτρέπει στους προγραμματιστές να εκτελούν συγκεκριμένες εργασίες μέσω του Claude απευθείας από το τερματικό τους.
Σε μια επίδειξη, οι υπάλληλοι της Anthropic έδειξαν πώς το Claude Code μπορεί να αναλύσει ένα έργο κωδικοποίησης με μια απλή εντολή όπως, «Εξηγήστε αυτή τη δομή του έργου». Χρησιμοποιώντας απλά αγγλικά στη γραμμή εντολών, ένας προγραμματιστής μπορεί να τροποποιήσει μια βάση κώδικα.
Το Claude Code θα είναι αρχικά διαθέσιμο σε έναν περιορισμένο αριθμό χρηστών σε μια βάση «first come, first serve», δήλωσε εκπρόσωπος της Anthropic στο TechCrunch.