Στο επίκεντρο των τελευταίων ανακοινώσεων της Google βρίσκεται το Gemini, το πιο προηγμένο και ικανό μοντέλο τεχνητής νοημοσύνης της εταιρείας μέχρι σήμερα.
Σε μια προσπάθεια να καταστήσει την τεχνητή νοημοσύνη (AI) καθολικά ωφέλιμη, η Google παρουσίασε μια σειρά από αναβαθμίσεις στη φετινή εκδήλωση Google I/O που πραγματοποιήθηκε στην Καλιφόρνια. Τα φώτα της δημοσιότητας ήταν στραμμένα στο Gemini, το μεγαλύτερο και πιο εξελιγμένο μοντέλο τεχνητής νοημοσύνης της Google.
Η εταιρεία υπογράμμισε ότι πριν από ένα χρόνο στη φάση I/O, η Google παρουσίασε για πρώτη φορά τα σχέδια για το Gemini, μια οικογένεια πολυτροπικών μοντέλων AI ικανή να επεξεργάζεται και να αναλύει κείμενο, εικόνες, βίντεο, κώδικα και άλλα.
Κατά τη διάρκεια του φετινού Google I/O, όπως αναφέρεται στην ανακοίνωση, “η Google έδειξε ότι είμαστε πλήρως λειτουργικοί στην εποχή Gemini, παρουσιάζοντας καινοτόμες λύσεις AI σε προϊόντα, έρευνα και υποδομές. Αυτό μας φέρνει πιο κοντά στον απώτερο στόχο μας να κάνουμε την Τεχνητή Νοημοσύνη χρήσιμη για όλους”.
Η Google ανακοίνωσε ότι όλα τα προϊόντα της, που εξυπηρετούν πλέον πάνω από δύο δισεκατομμύρια χρήστες, βασίζονται στην τεχνολογία Gemini.
Η εκδήλωση επικεντρώθηκε στο πώς η τεχνολογία αυτή βοηθά τους χρήστες στη δημιουργία νέων εμπειριών και στην ενίσχυση της χρησιμότητας των προϊόντων της Google.
Συγκεκριμένα, η Google ανακοίνωσε, απευθυνόμενη σε ένα ευρύ κοινό:
– “Επέκταση των επισκοπήσεων AI στην αναζήτηση. Με ένα νέο προσαρμοσμένο μοντέλο Gemini – ικανό για συλλογισμό πολλών βημάτων, προγραμματισμό και πολυτροπικότητα – σε συνδυασμό με την καλύτερη στην κατηγορία της Αναζήτησης, σύντομα θα μπορείτε να κάνετε σύνθετα ερωτήματα πολλών βημάτων, να προσαρμόζετε τα αποτελέσματα αναζήτησης και ακόμη και να θέτετε ερωτήσεις με βίντεο.
– Παρουσιάζουμε το Ask Photos. Πάνω από έξι δισεκατομμύρια φωτογραφίες μεταφορτώνονται καθημερινά στις Φωτογραφίες Google. Με τις πολυτροπικές δυνατότητες του Gemini, επαναπροσδιορίζουμε τον τρόπο με τον οποίο μπορείτε να αναζητήσετε τις φωτογραφίες και τα βίντεό σας. Είτε θέλετε να εντοπίσετε μια συγκεκριμένη ανάμνηση είτε να ανακτήσετε κρυμμένες πληροφορίες στη συλλογή σας, απλά ρωτήστε τις Φωτογραφίες.
– Νέοι τρόποι αλληλεπίδρασης με το Gemini στο χώρο εργασίας. Οι δυνατότητες του Gemini θα επεκταθούν σε περισσότερους χρήστες και θα ενσωματωθούν στον πλευρικό πίνακα του Gmail, των Docs, του Drive, των Slides και των Sheets. Επιπλέον, οι δυνατότητες του Gemini θα προστεθούν στην εφαρμογή Gmail για κινητά.
– Gemini για Android. Ενσωματώνουμε την τεχνολογία τεχνητής νοημοσύνης απευθείας στο λειτουργικό σύστημα Android. Οι μαθητές μπορούν πλέον να λαμβάνουν βοήθεια για τις εργασίες τους χρησιμοποιώντας το Circle to Search. Η επικάλυψη Gemini θα παρέχει δυναμικές προτάσεις με βάση το τι υπάρχει στην οθόνη σας. Για παράδειγμα, μπορείτε να ζητήσετε μια περίληψη ενός PDF ή να χρησιμοποιήσετε την επιλογή “Ρωτήστε αυτό το βίντεο”. Επιπλέον, το TalkBack που υποστηρίζεται από το Gemini θα προσφέρει ακόμα πιο λεπτομερείς περιγραφές εικόνων”.
Επιπλέον, η Google ανακοίνωσε την κυκλοφορία του “Gemini 1.5 Pro για τους συνδρομητές του Gemini Advanced σε περισσότερες από 35 γλώσσες, μαζί με μια σουίτα από ένα εκατομμύριο ακολουθίες χαρακτήρων κειμένου που οι LLMs μετατρέπουν σε αριθμητικές αναπαραστάσεις. Το Gemini 1.5 Pro είναι το μεγαλύτερο διαθέσιμο chatbot για τους καταναλωτές παγκοσμίως. Αυτό σημαίνει ότι μπορεί να κατανοήσει περισσότερες πληροφορίες από ποτέ, όπως ένα αρχείο PDF 1.500 σελίδων, και σύντομα θα είναι σε θέση να κατανοήσει 30.000 γραμμές κώδικα καθώς και βίντεο διάρκειας μιας ώρας”.
Οι συνδρομητές του Gemini Advanced θα έχουν σύντομα πρόσβαση στο Live, μια νέα εμπειρία συνομιλίας για κινητά. “Με το Live, θα μπορείτε να μιλάτε στο Gemini και να επιλέγετε από ένα ευρύ φάσμα φωνών με φυσικό ήχο. Μπορείτε επίσης να συνομιλείτε με το δικό σας ρυθμό, κάνοντας παύσεις με ερωτήσεις για να κάνετε τις συζητήσεις πιο κατανοητές”, δήλωσε η Google.
Ανακοινώθηκε επίσης ότι η Google συνεργάζεται στενά με τη δημιουργική κοινότητα για να διερευνήσει πώς η παραγωγική Τεχνητή Νοημοσύνη μπορεί να υποστηρίξει καλύτερα τη δημιουργική διαδικασία και να διασφαλίσει ότι τα εργαλεία Τεχνητής Νοημοσύνης θα είναι όσο το δυνατόν πιο χρήσιμα σε κάθε στάδιο:
– Τα αποκαλυπτήρια του Veo, του πιο ικανού μοντέλου για τη δημιουργία βίντεο υψηλής ευκρίνειας, και του Imagen 3, ενός μοντέλου με την υψηλότερη ποιότητα για τη μετατροπή κειμένου σε εικόνες. Επίσης, μερικές νέες ηχογραφήσεις -με καλλιτέχνες από όλο τον κόσμο- που δημιουργήθηκαν με το Music AI Sandbox.
Οι εξελίξεις στην Τεχνητή Νοημοσύνη μπορούν να πραγματοποιηθούν μόνο μέσω πραγματικά καινοτόμων τεχνολογικών υποδομών. Η εκπαίδευση μοντέλων αιχμής απαιτεί σημαντική υπολογιστική ισχύ.
– Η παρουσίαση της Trillium, της 6ης γενιάς TPU, η οποία προσφέρει 4,7 φορές καλύτερη υπολογιστική απόδοση ανά τσιπ σε σύγκριση με την προηγούμενη γενιά, την TPU v5e. Θα είναι διαθέσιμη στους πελάτες του Cloud αργότερα φέτος.
Ένα βασικό στοιχείο της τολμηρής καινοτομίας είναι η υπεύθυνη καινοτομία. Έτσι, αναπτύσσουμε μια τεχνολογία αιχμής γνωστή ως “AI-assisted red teaming”, βασισμένη σε καινοτόμα χαρακτηριστικά παιχνιδιών που αναπτύχθηκαν από την Google DeepMind, όπως το AlphaGo, επεκτείνοντας τις καινοτομίες μας για την υδατογράφηση, όπως το SynthID, σε δύο νέες μορφές – κείμενο και βίντεο – έτσι ώστε το περιεχόμενο που δημιουργείται από την Τεχνητή Νοημοσύνη να ανιχνεύεται ευκολότερα.
Αξιοποιώντας τη δύναμη του Gemini, στοχεύουμε να κάνουμε την Τεχνητή Νοημοσύνη χρήσιμη για όλους. Η αποστολή της Google είναι να οργανώσει τις πληροφορίες του κόσμου από κάθε πηγή, να τις καταστήσει προσβάσιμες με κάθε μέσο και να ενσωματώσει τις παγκόσμιες πληροφορίες με τις δικές σας με τρόπο που να είναι πραγματικά χρήσιμος για εσάς. Το Gemini θα μας βοηθήσει να επιτύχουμε αυτόν τον στόχο, τονίζεται στην ανακοίνωση.