Από τότε που το σύστημα τεχνητής νοημοσύνης Deep Blue της IBM νίκησε τον παγκόσμιο πρωταθλητή σκακιού Garry Kasparov το 1997, η ανθρωπότητα παρακολουθεί τα τεχνητά δημιουργήματα της να υπερέχουν σε όλο και πιο περίπλοκα παιχνίδια. Με ένα όριο όμως. ενώ τα ρομπότ τεχνητής νοημοσύνης διαπρέπουν ολοένα και περισσότερο στο να ξεπερνούν τους ανθρώπους σε επιτραπέζια παιχνίδια και βιντεοπαιχνίδια, τα συστήματα συνήθως τα πηγαίνουν πολύ χειρότερα όταν λαμβάνουν οδηγίες να συνεργαστούν με άλλους ανθρώπους για να ολοκληρώσουν μια κοινή εργασία.
Οι ερευνητές της εταιρείας Meta, μητρικής του Facebookπιστεύουν ότι το νέο τους σύστημα AI με το όνομα «Cicero» έχει κάτι να πει για αυτό τοως τώραόριο της τεχνητής νοημοσύνης. Για πρώτη φορά, σύμφωνα με μια νέα μελέτη που κοινοποιήθηκε στο Gizmodo από την ομάδα της Meta’s Fundamental AI Research Diplomacy, οι ερευνητές εκπαίδευσαν μια τεχνητή νοημοσύνη για να επιτύχει «ανθρώπινο επίπεδο απόδοσης» στο επιτραπέζιο παιχνίδι στρατηγικής πολέμου Diplomacy.
Ο νέος εκπρόσωπος της τεχνητής νοημοσύνης, που πήρε το όνομά του από τον κλασικό πολιτικό και λόγιο που είδε την πτώση της Ρωμαϊκής Δημοκρατίας, ήταν σε θέση να επικοινωνεί αποτελεσματικά και να κάνει στρατηγικούς σχεδιασμούς με άλλους ανθρώπους, να σχεδιάζει τις καλύτερες μεθόδους νίκης και σε ορισμένες περιπτώσεις, ακόμη και να περνάει ως άνθρωπος. Τώρα, οι ερευνητές λένε ότι το Cicero, το οποίο ολοκλήρωσε τα καθήκοντά του συνδυάζοντας μοντέλα διαλόγου και στρατηγικής συλλογιστικής, αποτελεί «σημείο αναφοράς» για τη μάθηση κι άλλων συστημάτων AI.
Οι ερευνητές της Meta που έκαναν τη σχετική δημοσίευση στο περιοδικό «Science» λένε ότι το Cicero υπερδιπλασίασε τη μέση βαθμολογία των ανθρώπινων παικτών σε 40 ανώνυμα διαδικτυακά παιχνίδια Diplomacy και κατατάχθηκε στο κορυφαίο 10% των παικτών που έπαιξαν περισσότερα από ένα παιχνίδια. Το Cicero κατέλαβε μάλιστα την 1η θέση σε ένα τουρνουά οκτώ παιχνιδιών με 21 συμμετέχοντες. Σε κάθε στάδιο του παιχνιδιού, το Cicero μοντελοποιούσε τον τρόπο με τον οποίο άλλοι ανταγωνιστές παίκτες ήταν πιθανό να ενεργήσουν με βάση την απόδοση του παιχνιδιού τους και τις γραπτές συνομιλίες που είχαν.
Οι ερευνητές πραγματοποίησαν την πειραματική μελέτη τους στο διάστημα μεταξύ 19 Αυγούστου και 13 Οκτωβρίου 2022 σε 40 ανώνυμα διαδικτυακά παιχνίδια weDiplomacy.net συνολικού χρόνου 72 ωρών παιχνιδιού. Οι ερευνητές λένε ότι δεν είδαν μηνύματα εντός του παιχνιδιού που να υποδηλώνουν ότι οι ανθρώπινοι παίκτες πίστευαν ότι έπαιζαν εναντίον ενός AI. Το Cicero προφανώς «πέρασε ως άνθρωπος παίκτης», σε 40 παιχνίδια της Διπλωματίας με 82 μοναδικούς παίκτες. Μόνο ένας ανέφερε (κατόπιν… εορτής) πως είχε κάποιες υποψίες ότι ένας συμπαίκτης του δεν ήταν άνθρωπος.
Σε μια περίπτωση μάλιστα που τονίστηκε στη μελέτη, Το Cicero ήταν σε θέση να αλλάξει επιτυχώς τη γνώμη ενός ανθρώπινου παίκτη προτείνοντας μια αμοιβαία επωφελής κίνηση. Το Cicero εκπαιδεύτηκε σε ένα μεγάλο κομμάτι προηγούμενων δεδομένων γύρω από το παιχνίδι προκειμένου να το προετοιμάσει για τη σωστή επικοινωνία με άλλους παίκτες. Οι ερευνητές λένε ότι η τεχνητή νοημοσύνη εκπαιδεύτηκε σε ένα σύνολο δεδομένων από 125.261 ανώνυμα παιχνίδια διπλωματίας, περίπου 40.000 από τα οποία περιείχαν διάλογο. Συνολικά, αυτό το σύνολο δεδομένων περιείχε πάνω από 12 εκατομμύρια μηνύματα που ανταλλάσσονταν μεταξύ ανθρώπων παικτών.
Στα ελαττώματα του AI συστήματος, οι ερευνητές αναφέρουν ότι ο διάλογος του περιοριζόταν κυρίως σε ενέργειες στην τρέχουσα σειρά του και ότι δεν ήταν καλό στο να μοντελοποιήσει πώς ο διάλογός του με έναν παίκτη θα μπορούσε να επηρεάσει τις σχέσεις με τους άλλους μακροπρόθεσμα. Επίσης έστελνε περιστασιακά μηνύματα που περιείχαν «λάθη γείωσης» ή άλλα που έρχονταν σε αντίθεση με τα δικά του σχέδια. (Αξίζει να σημειωθεί ότι οι άνθρωποι συχνά κάνουν τα ίδια λάθη).
Ωστόσο, παρά αυτές τις επιφυλάξεις, οι ερευνητές θεωρούν ότι το Cicero θα πρέπει να πάρει τη θέση του στο hall of fame τέτοιων παιχνιδιών λόγω της μοναδικής ικανότητάς του να συνεργάζεται με τους ανθρώπους.