Τα καλοκαίρια, ο Αλέξανδρος Πέππας βοηθούσε τον πατέρα του, τον επιχειρηματία Σπύρο Πέππα, στο στέκι της κοσμικής Αθήνας, το θρυλικό restaurant-bar «Alekos» στον Κάλαμο. Τους χειμώνες, ωστόσο, αφιέρωνε τον χρόνο του στο να κάνει το όνειρό του πραγματικότητα: σπουδάζοντας στην Πολυτεχνική Σχολή του Δημοκρίτειου Πανεπιστημίου Θράκης (ΔΠΘ) ως Ηλεκτρολόγος Μηχανικός και Μηχανικός Υπολογιστών.
Σήμερα, ως Senior Software Engineer της Microsoft, ο Αλέξανδρος Πέππας μιλά με ενθουσιασμό για την τεχνητή νοημοσύνη (AI), τους Agents –το νέο κύμα εφαρμογών μέσω της AI– και την εγκατάστασή του στο Δουβλίνο, τη «Silicon Valley» της Ευρώπης. Σε αποκλειστική συνέντευξη στο Newsbeast, εξηγεί τι είναι η τεχνητή νοημοσύνη, ποια είναι τα οφέλη της και πώς η προσωπική του ηθική επηρεάζει τη δουλειά του στον τομέα αυτόν.
–Πώς παρουσιάστηκε η ευκαιρία για τη Microsoft;
Όταν εργαζόμουν στην Ελλάδα, διαπίστωσα πως η κλίμακα των προκλήσεων δεν με ενθουσίαζε, δεν με γέμιζε. Ήθελα να συμμετέχω σε projects που θα είχαν παγκόσμιο αντίκτυπο, επηρεάζοντας εκατοντάδες εκατομμύρια ανθρώπους. Είχα την ανάγκη να βγω και να δουλέψω πάνω σε εφαρμογές που έχουν μεγαλύτερη απήχηση και πεδίο. Έτσι, πήρα την απόφαση να αναζητήσω θέσεις εργασίας σε μεγάλες τεχνολογικές εταιρείες, όπως η Microsoft, η Google και η Amazon.
–Φαντάζομαι ότι δεν είναι εύκολο να μπεις και να εργαστείς σε μια τέτοια εταιρεία. Πώς ήταν η εγκατάσταση στο Δουβλίνο και ποιες οι προκλήσεις;
Όποιος έχει κάνει το «βήμα» να φύγει για το εξωτερικό γνωρίζει πως το συναίσθημα είναι γλυκόπικρο. Σπούδασα στην Πολυτεχνική Σχολή των Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του Δημοκρίτειου Πανεπιστημίου Θράκης, όπου αρκετοί συμφοιτητές μου είχαν ήδη φύγει πριν από μένα για το εξωτερικό. Έχοντας συζητήσει πολλές φορές το συγκεκριμένο ζήτημα, έχω καταλήξει στο συμπέρασμα ότι αυτή η επιλογή έχει τόσο θετικές όσο και αρνητικές πτυχές.
Αρχικά, οι προκλήσεις είναι αναπόφευκτες. Αφήνεις πίσω σου οικογένεια και αγαπημένα πρόσωπα και πορεύεσαι προς το άγνωστο. Όταν έφτασα στο Δουβλίνο, το μόνο εύκολο και θετικό στην αρχή ήταν η γλώσσα και η επικοινωνία, καθώς οι Ιρλανδοί είναι «ζεστοί» και φιλόξενοι, θυμίζοντας τη δική μας φιλοξενία. Από την άλλη, η μεγαλύτερη πρόκληση που αντιμετώπισα ήταν η στεγαστική κρίση.
Όπως είναι γνωστό, τον Ιανουάριο του 2020 έγινε το Brexit, και την ίδια περίπου περίοδο ξεκίνησε η μετεγκατάσταση τεχνολογικών κολοσσών, όπως η Microsoft, η Meta και η Google, με τα κεντρικά τους γραφεία για την Ευρώπη, τη Μέση Ανατολή και την Αφρική (EMEA Headquarters) να μεταφέρονται στο Δουβλίνο. Ταυτόχρονα, η Ιρλανδία, μειώνοντας τον εταιρικό φόρο στο 12,5%, προσέλκυσε ακόμα περισσότερες εταιρείες, μετατρέποντας προοδευτικά το Δουβλίνο σε μια «Silicon Valley» της Ευρώπης. Ωστόσο, αυτή η εξέλιξη εκτόξευσε τη ζήτηση σε κατοικίες, ξεπερνώντας κατά πολύ την προσφορά.
Η εύρεση κατοικίας στο Δουβλίνο αποδείχθηκε εξαιρετικά δύσκολη. Είναι συνηθισμένο να χρειάζεται κανείς μήνες για να βρει στέγη, με τα ενοίκια να είναι πανάκριβα και υπερτιμημένα. Αυτή τη στιγμή, το Δουβλίνο θεωρείται μία από τις ακριβότερες πρωτεύουσες για διαμονή στην Ευρώπη. Γνωρίζω περιπτώσεις συνεργατών μου που χρειάστηκαν πέντε ή και έξι μήνες για να βρουν στέγη. Προσωπικά, έψαχνα εντατικά για τρεις μήνες μέχρι να βρω κατοικία.
–Το εργασιακό καθεστώς και περιβάλλον μέσα στη Microsoft;
Η Microsoft απασχολεί περισσότερους από διακόσιους είκοσι χιλιάδες εργαζόμενους παγκοσμίως, αποτελώντας ένα τρομερά πολυσυλλεκτικό, πολυμορφικό και πολιτισμικό περιβάλλον. Η συνεργασία με ανθρώπους από κάθε γωνιά του πλανήτη είναι δεδομένη, και για να αντεπεξέλθει κανείς, χρειάζεται ανοιχτό μυαλό και αποδοχή διαφορετικών κουλτούρων, ιδεών, προτύπων και εμπειριών.
Στο Δουβλίνο, που αποτελεί τα κεντρικά γραφεία της Microsoft για την Ευρώπη, τη Μέση Ανατολή και την Αφρική, εργάζονται περισσότεροι από τρεισήμισι χιλιάδες εργαζόμενοι από πάνω από ενενήντα εθνικότητες. Είναι προφανές ότι πρόκειται για ένα πολυπολιτισμικό και πολυπληθυσμικό «μείγμα» ανθρώπων, το οποίο εμπλουτίζει καθημερινά το εργασιακό περιβάλλον.
Πέρα από τη μοναδικότητα του ανθρώπινου δυναμικού, υπάρχουν σημαντικές τεχνολογικές προκλήσεις. Όταν σχεδιάζεις και υλοποιείς μια εφαρμογή για έναν κολοσσό όπως η Microsoft, χρειάζεται να προσεγγίζεις τη διαδικασία με «μηχανική ωριμότητα». Τα προϊόντα που παράγονται προορίζονται για εκατομμύρια χρήστες σε ολόκληρο τον κόσμο, συνεπώς η ευθύνη είναι τεράστια, ενώ το περιβάλλον εξαιρετικά ανταγωνιστικό.
Για παράδειγμα, το δίκτυο επαφών που μπορεί να δημιουργήσει κάποιος εργαζόμενος σε αυτή την εταιρεία δεν έχει όρια. Τον τελευταίο ενάμιση χρόνο, συμμετείχα σε ένα νέο έργο που αφορά την τεχνητή νοημοσύνη και το κύμα των Agents. Τον Μάιο του 2024, ο CEO της Microsoft, Satya Nadella, παρουσίασε τα ευρήματα της ομάδας μας στο παγκόσμιο συνέδριο Microsoft Build. Μέχρι τον Νοέμβριο, τα ευρήματα αυτά είχαν μετατραπεί σε προϊόν έτοιμο για διάθεση, το Microsoft Copilot Studio – Agents, το οποίο παρουσιάστηκε ξανά από τον Satya Nadella στο παγκόσμιο συνέδριο Microsoft Ignite.
–Τι είναι τελικά η τεχνητή νοημοσύνη;
Ας σκεφτούμε από πού προέρχεται η τεχνητή νοημοσύνη: από τον κλάδο της επιστήμης των υπολογιστών. Στόχος της είναι η δημιουργία μηχανών που μπορούν να εκτελούν διεργασίες που απαιτούν ανθρώπινη νοημοσύνη. Αυτές οι διεργασίες περιλαμβάνουν τη μάθηση, τον αφαιρετικό συλλογισμό, την επίλυση προβλημάτων, τον προγραμματισμό και άλλα.
Στον πυρήνα της τεχνητής νοημοσύνης βρίσκονται δύο βασικά στοιχεία: αφενός οι τεράστιοι όγκοι δεδομένων (data) και αφετέρου οι αλγόριθμοι που επιτρέπουν στα μοντέλα τεχνητής νοημοσύνης να μιμούνται τις ανθρώπινες γνωστικές ικανότητες.
Για να αντιληφθούμε πώς φτάσαμε έως εδώ, ας κάνουμε μια σύντομη ιστορική αναδρομή. Το 1950, ο μαθηματικός Άλαν Τούρινγκ έθεσε το ερώτημα: «Μπορεί μια μηχανή να σκεφτεί;». Τότε εισήχθη το περίφημο Turing Test, το οποίο υποστήριζε ότι η τεχνητή νοημοσύνη θα μπορούσε να θεωρηθεί ισοδύναμη με την ανθρώπινη όταν ένας άνθρωπος δεν θα μπορεί να ξεχωρίσει αν συνομιλεί με μηχανή ή με άνθρωπο. Ενώ για την εποχή αυτό φαινόταν εξωπραγματικό, σήμερα είναι αρκετά εφικτό.
Οι πρώτες έρευνες για τα τεχνητά νευρωνικά δίκτυα, τον πυρήνα της σύγχρονης τεχνητής νοημοσύνης, ξεκίνησαν τη δεκαετία του 1940 και του 1950. Ο στόχος ήταν να μιμηθεί ο ανθρώπινος εγκέφαλος και τα βιολογικά νευρωνικά δίκτυα. Αυτή η προσπάθεια συνεχίζεται ως σήμερα.
Στη δεκαετία του 1970 και του 1980, η τεχνητή νοημοσύνη πέρασε τον πρώτο «χειμώνα» της, με μείωση του ενδιαφέροντος και της χρηματοδότησης. Ωστόσο, το 1997 η νίκη του συστήματος Deep Blue της IBM απέναντι στον παγκόσμιο πρωταθλητή σκακιού Γκάρι Κασπάροφ αποτέλεσε ορόσημο για την αναβίωσή της.
Στη δεκαετία του 2010, τα τεχνητά νευρωνικά δίκτυα πολλαπλών επιπέδων έγιναν θεμελιώδη. Το 2017, η ερευνητική ομάδα της Google παρουσίασε την εργασία «Attention is All You Need», εισάγοντας την αρχιτεκτονική των transformers. Αυτή η τεχνολογία αποτέλεσε τη βάση για τη δημιουργία μεγάλων γλωσσικών μοντέλων, όπως τα σημερινά που γνωρίζουμε.
Η τεχνητή νοημοσύνη προέκυψε από τη φιλοδοξία του ανθρώπου να επεκτείνει τις πνευματικές του ικανότητες και να κατανοήσει τη λειτουργία της βιολογικής νοημοσύνης. Σήμερα, έχει γίνει αναπόσπαστο μέρος της καθημερινότητάς μας, από τα φίλτρα στο Instagram και το TikTok, την πρόβλεψη του καιρού, τα αυτόνομα οχήματα, μέχρι τις ψηφιακές βοηθούς όπως η Siri και η Alexa. Παρότι χρησιμοποιείται εδώ και χρόνια, είναι η πρώτη φορά που έρχεται τόσο έντονα στο προσκήνιο.
–Πώς λειτουργεί;
Όπως είπαμε και προηγουμένως, όσοι αναφέρονται πλέον στην τεχνητή νοημοσύνη εστιάζουν στα μεγάλα γλωσσικά μοντέλα (LLMs), τα οποία έχουν τη δυνατότητα να αναπαράγουν κείμενο όπως θα έκανε και ένας άνθρωπος. Ένας βαθύτατα ενημερωμένος και «διαβασμένος» άνθρωπος, θα έλεγα.
Τα μοντέλα αυτά είναι ικανά να απαντούν σε διάφορα ζητήματα. Μπορείς να τα χρησιμοποιήσεις για να γράψεις ποίηση ή στίχους για το καινούργιο σου τραγούδι ή να ζητήσεις συνταγές μαγειρικής, όπως μελομακάρονα για τα Χριστούγεννα. Παράλληλα, μπορείς να εμβαθύνεις και σε πιο σύνθετα θέματα: να ρωτήσεις για φιλοσοφία, να εξερευνήσεις τα μυστήρια των «μαύρων τρυπών», να συζητήσεις για την ακτινοβολία Hawking ή την κβαντική μηχανική. Με λίγα λόγια, να κάνεις πράγματα που κυριολεκτικά «στύβουν» το μυαλό!
Πολλές φορές αναρωτιόμαστε πώς αυτά τα μοντέλα καταφέρνουν να απαντούν ως ειδήμονες σε κάθε κλάδο. Αυτό είναι το συναρπαστικό! Όπως προαναφέραμε, το 2017 δημοσιεύθηκε το διάσημο paper «Attention is All You Need», το οποίο εισήγαγε έναν νέο τρόπο για να κατανοούν οι υπολογιστές τη σχέση μεταξύ των λέξεων μέσα σε ένα κείμενο.
Τα μοντέλα αυτά εκπαιδεύονται σε τεράστιες ποσότητες δεδομένων (μερικά έχουν διαβάσει ολόκληρο το διαδίκτυο!) και δημιουργούν έναν εκτενή γλωσσικό πυρήνα βασισμένο σε όσα γνωρίζουμε μέχρι σήμερα. Όσο περισσότερα δεδομένα, παραμέτρους ή υπολογιστική ισχύ παρέχουμε στα μοντέλα, τόσο πιο ακριβείς και αποτελεσματικές γίνονται οι απαντήσεις τους. Αυτό το φαινόμενο είναι γνωστό ως «νόμος της κλιμάκωσης» (scaling law), αν και φαίνεται να φτάνει στα όριά του, καθιστώντας αναγκαία την ανάπτυξη νέων, πιο έξυπνων μεθόδων βελτίωσης πέρα από το scaling.
Πώς λειτουργούν αυτά τα μοντέλα; Λαμβάνουν ένα κείμενο εισόδου, το κατακερματίζουν σε μικρότερες μονάδες (tokens) και αναλύουν τις συσχετίσεις των λέξεων στο περιεχόμενό του. Με βάση τα δεδομένα που έχουν επεξεργαστεί, προβλέπουν ποια λέξη ή φράση έχει τη μεγαλύτερη πιθανότητα να συμπληρώσει την πρόταση εισόδου. Επαναλαμβάνοντας αυτή τη διαδικασία, παράγουν κείμενο που φαίνεται φυσικό και συναφές. Για παράδειγμα, αν γράψεις στο ChatGPT «the sun rises» (ο ήλιος ανατέλλει), πιθανότατα θα σου απαντήσει «the sun rises from the east» (ο ήλιος ανατέλλει από την ανατολή), επειδή έχει μάθει ότι οι φράσεις «sun rises» και «east» συσχετίζονται.
Ένα άλλο σημαντικό θέμα που προκαλεί φρενίτιδα είναι οι AI Agents. Όλες οι μεγάλες εταιρείες επενδύουν σε αυτό το νέο «κύμα», εκμεταλλευόμενες τις τεράστιες δυνατότητές τους. Τον τελευταίο ενάμιση χρόνο, η ομάδα μου και εγώ έχουμε ερευνήσει τους Agents, οι οποίοι είναι εφαρμογές που χρησιμοποιούν LLMs σε συνδυασμό με εργαλεία και δεδομένα για να αυτονομούνται και να εκτελούν επαναλαμβανόμενες διεργασίες.
Για παράδειγμα, ένας Agent μπορεί να διαχειρίζεται αυτόματα emails, να οργανώνει το καθημερινό πρόγραμμα ή να εκτελεί αναλύσεις δεδομένων χωρίς ανθρώπινη παρέμβαση. Στο μέλλον, θα έχουμε ομάδες από Agents που θα αναλαμβάνουν εξειδικευμένες αρμοδιότητες, απελευθερώνοντάς μας από χρονοβόρες διαδικασίες και επιτρέποντάς μας να επικεντρωνόμαστε σε πιο δημιουργικά και ουσιώδη ζητήματα.
-Ποια τα οφέλη της;
Τα οφέλη είναι τεράστια! Από την αυτοματοποίηση εργασιών και την αύξηση της παραγωγικότητας, όπως η συνεργασία για την προετοιμασία ενός καλοδουλεμένου περιεχομένου για την επόμενη συνέντευξή σου, μέχρι τη συμβολή στη λήψη κρίσιμων αποφάσεων στον τομέα της υγείας. Τα συστήματα τεχνητής νοημοσύνης μπορούν να αναλύουν δεδομένα διαφόρων ασθενειών, να προτείνουν θεραπείες ή ακόμα και να διαγιγνώσκουν ασθένειες πριν αυτές εμφανιστούν!
Παράλληλα, στον οικονομικό τομέα, οι μεγάλες επενδυτικές τράπεζες, όπως η Goldman Sachs και η JP Morgan, χρησιμοποιούν εξελιγμένους αλγόριθμους τεχνητής νοημοσύνης για να εντοπίζουν απάτες ή να διαχειρίζονται πολύπλοκα επενδυτικά χαρτοφυλάκια.
Για μένα, όμως, η μεγαλύτερη πρόκληση είναι η αξιοποίηση όλης αυτής της υπολογιστικής πολυπλοκότητας των μοντέλων και των αλγορίθμων για έρευνα αιχμής. Για παράδειγμα, η σύνθεση νέων πρωτεϊνών που μπορούν να οδηγήσουν στη δημιουργία αποτελεσματικών φαρμάκων κατά του καρκίνου, του Αλτσχάιμερ και άλλων ασθενειών που μαστίζουν την ανθρωπότητα.
Τέλος, εξίσου σημαντική είναι η δυνατότητα μεταμόρφωσης της εκπαίδευσης, ιδιαίτερα σε υπό ανάπτυξη χώρες, όπου παιδιά και ενήλικες συχνά δεν έχουν πρόσβαση σε δωρεάν και ποιοτική μάθηση. Με τη δημιουργία «καθηγητών» τεχνητής νοημοσύνης (AI tutors), μπορούμε να παρέχουμε εκπαίδευση υψηλής ποιότητας, ανεξαρτήτως κοινωνικοοικονομικού υπόβαθρου.
Το φάσμα των δυνατοτήτων που προσφέρει αυτή η τεχνολογία είναι εντυπωσιακά μεγάλο και οι ευκαιρίες που θα δημιουργήσει στο μέλλον είναι πραγματικά συναρπαστικές!
-Πάμε στο κεφάλαιο ηθική και προκλήσεις της τεχνητής νοημοσύνης
Όπως συμβαίνει με κάθε μεγάλη «επανάσταση» που αλλάζει τις κοινωνίες και τις οικονομίες, έτσι και η τεχνητή νοημοσύνη φέρνει τα δικά της ηθικά διλήμματα και προκλήσεις. Αν δούμε ιστορικά, από την Ψηφιακή Επανάσταση της δεκαετίας του 1970-1990 με την είσοδο των προσωπικών υπολογιστών και κινητών τηλεφώνων, μέχρι την Επανάσταση του Διαδικτύου (1990-2000) και την επανάσταση των mobile εφαρμογών (2000-2010), κάθε φάση εξέλιξης συνοδευόταν από ευκαιρίες αλλά και ανησυχίες. Σήμερα, από το 2010 και μετά, ζούμε την Επανάσταση της Τεχνητής Νοημοσύνης και της Αυτοματοποίησης, η οποία ανοίγει νέους ορίζοντες, αλλά ταυτόχρονα θέτει κρίσιμα ερωτήματα.
Μία από τις προκλήσεις είναι η θέση του ανθρώπου στην κοινωνία της λεγόμενης Γενικής Τεχνητής Νοημοσύνης (Artificial General Intelligence – AGI). Τι γίνεται όταν όλα αυτοματοποιηθούν; Όταν ο άνθρωπος έχει άφθονο ελεύθερο χρόνο επειδή δεν χρειάζεται πλέον να εργάζεται; Θα έχει περισσότερες ευκαιρίες να σκέφτεται, να φιλοσοφεί, να περνά χρόνο με την οικογένειά του, τους φίλους του και τα αγαπημένα του πρόσωπα. Αλλά τι σημαίνει να έχεις «όλο τον χρόνο»; Είναι ένα φιλοσοφικό ερώτημα που ταλανίζει την επιστημονική κοινότητα. Από πάντα, η εργασία ήταν βαθιά ριζωμένη στην ταυτότητα του ανθρώπου, προσφέροντας σκοπό, κίνητρο για ανέλιξη και δημιουργία. Αν αυτό χαθεί, ίσως χαθεί ένα σημαντικό μέρος της ταυτότητάς μας.
Όσον αφορά την ηθική, το ζήτημα γίνεται ακόμα πιο περίπλοκο. Δεδομένου ότι τα μεγάλα γλωσσικά μοντέλα (LLMs) εκπαιδεύονται σε δεδομένα που έχουν δημιουργηθεί και κοινοποιηθεί από ανθρώπους στο διαδίκτυο, υπάρχει ο κίνδυνος να αναπαραχθούν προκαταλήψεις. Αυτές οι προκαταλήψεις μπορεί να επηρεάσουν την εκτίμηση της πραγματικότητας που έχει το μοντέλο για τον κόσμο μας, ακόμα και υποσυνείδητα. Οι συνέπειες θα μπορούσαν να είναι σοβαρές σε κρίσιμους τομείς, όπως οι διαδικασίες πρόσληψης εργαζομένων, η χορήγηση τραπεζικών δανείων, η απονομή δικαιοσύνης και άλλα. Αν δεν υπάρξει προσεκτική ρύθμιση, αυτές οι επιπτώσεις μπορεί να επιδεινώσουν τη θέση ομάδων που ήδη βρίσκονται σε μειονεκτική θέση.
Συμπερασματικά, η προσωπική μου άποψη είναι πως η τεχνητή νοημοσύνη έχει τη δυναμική να δημιουργήσει ένα φάσμα συναρπαστικών ευκαιριών και να εξελίξει σημαντικούς τομείς της ανθρωπότητας. Ωστόσο, το μέλλον αυτής της τεχνολογίας απαιτεί συνετή διαχείριση, ισχυρές δικλείδες ασφαλείας και συνεχή επαγρύπνηση, ώστε να περιορίσουμε τις αρνητικές συνέπειες και να μεγιστοποιήσουμε τα οφέλη της.