
Λίγα λεπτά μετά την απελευθέρωση του τελευταίου μοντέλου του, ένας άλλος γίγαντας της τεχνητής νοημοσύνης έχει ήδη κλείσει μέρος της προσοχής.
Την Τρίτη, η Google δήλωσε το Gemini 2.5, το “πιο πνευματικό” μοντέλο της. Η εταιρεία δήλωσε ότι αυτή η αρχική έκδοση είναι “η πειραματική έκδοση του 2.5 Pro, η οποία είναι σύγχρονη σε ένα ευρύ φάσμα κριτηρίων και ντεμπούτο στο #1 στην Lmarena με σημαντικό περιθώριο”.
Επίσης: Δοκίμασα μια νέα ενημέρωση της λειτουργίας Voice CHATGPT – αυτό έχει αλλάξει
Η οικογένεια των μοντέλων σκέψης, που σημαίνει ότι λογικά μέσω των απαντήσεων τους, η απελευθέρωση ακολουθεί το flash -thinking του Google Gemini 2.0, η οποία προσγειώθηκε τον Δεκέμβριο.
Συγκεκριμένα, το Gemini 2.5 Pro Experimental OpenFormed Openai’s O3 Mini και το Anpropic Claude 3.7 Snock στις τελευταίες εξετάσεις ανθρωπότητας (HLE), που σχεδιάστηκε για την καταπολέμηση του κορεσμού ή του προβλήματος των δοκιμών της βιομηχανίας που γίνονται πολύ απλές για ταχέως αναπτυσσόμενα μοντέλα. Ως εκ τούτου, το HLE είναι ένα σχετικά πιο δύσκολο τεστ για να εκτελέσετε καλά. Ο Δίδυμος 2,5 κέρδισε 18,8% σε σύγκριση με το 14% O3 Mini (εκτιμάται μόνο χρησιμοποιώντας προβλήματα κειμένου, χωρίς εικόνες) και Claude 3,7 Sonnet’s 8,9%.
Ήδη με επικεφαλής τους ηγέτες του Chatbot Arena, το νέο μοντέλο ξεπέρασε επίσης τους ανταγωνιστές σε γενικούς δείκτες ελέγχου στην επιστήμη, τα μαθηματικά και την κωδικοποίηση, αν και συνήθως με μικρότερο περιθώριο, το οποίο αναμένεται τώρα, δεδομένης της ταχύτητας με την οποία επιταχύνονται τα νέα μοντέλα. Η Google είπε ότι το Experimental Gemini 2.5 Pro παρουσιάζει βελτιώσεις στη συλλογιστική, τις δυνατότητες πολλαπλών και πράκτορα, ακόμη και από την “ίδια γραμμή”.
Το νέο μοντέλο σημείωσε επίσης υψηλότερα από τους ανταγωνιστές του στη δοκιμή IQ που διεξήχθη ως αποτέλεσμα της δοκιμής του AI -AI, η οποία χρησιμοποιεί ερωτήσεις για παραγγελία που δεν είναι διαθέσιμες στο κοινό και επομένως δεν μπορούν να συμπεριληφθούν στα εκπαιδευτικά δεδομένα. Παρ ‘όλα αυτά, οι ειδικοί προειδοποιούν ότι οι δοκιμές για το ανθρώπινο IQ είναι, εκτός από τις αμφίβολες ρίζες στο ευγονικό, όχι ένα πολύ χρήσιμο μέτρο των δυνατοτήτων του μοντέλου AI, επειδή οι ανθρώπινες μεθόδους νοημοσύνης ενεργούν με σημαντικά διαφορετικούς τρόπους.
Το Σάββατο, η Google δημοσίευσε στο X ότι το Gemini 2.5 Pro είναι τώρα διαθέσιμο σε όλους τους χρήστες των δίδυμων “με περιορισμούς τιμών” μετά την αρχικά στενότερη απελευθέρωση και σύντομα θα εμφανιστεί στο κινητό. Οι χρήστες μπορούν να το δοκιμάσουν σήμερα στο gemini.google.com.
Παρόλο που η εταιρεία δεν ενημέρωσε τις λεπτομέρειες, επιβεβαίωσε ότι οι προχωρημένοι χρήστες των δίδυμων εξακολουθούν να “εκτεταμένες πρόσβαση” εκτός από ένα ευρύτερο παράθυρο περιβάλλοντος.
Θέλετε περισσότερες ιστορίες για το AI; Εγγραφείτε για καινοτομίαΗ εβδομαδιαία ψηφοφορία πληροφόρησης.