
Η αξία των αντιπροσώπων της ΑΙ, τα συστήματα που μπορούν να εκτελούν καθήκοντα για τους ανθρώπους είναι προφανή, με δυνατότητες αύξησης της παραγωγικότητας, ειδικά για τις επιχειρήσεις. Ωστόσο, η απόδοση των μεγάλων γλωσσών (LLMS) μπορεί να παρεμβαίνει στην αποτελεσματική ανάπτυξη παραγόντων. Η μελέτη του AI Salesforce επιδιώκει να λύσει αυτό το πρόβλημα.
Επίσης: το 60% των αντιπροσώπων του AI εργάζονται σε τμήματα πληροφορικής – αυτό είναι που κάνουν κάθε μέρα
Την Πέμπτη, το Salesforce ξεκίνησε την εναρκτήρια Salesforce AI Έρευνα σε μια κριτική Η έκθεση, υπογραμμίζοντας την καινοτομία της τεχνολογικής εταιρείας, συμπεριλαμβανομένων νέων θεμελιωδών εκδηλώσεων και ερευνητικών εργασιών για το τελευταίο τρίμηνο. Η Salesforce ελπίζει ότι αυτά τα έργα θα βοηθήσουν στην υποστήριξη της ανάπτυξης αξιόπιστων και ικανών παραγόντων του AI, οι οποίοι μπορούν να λειτουργήσουν καλά σε ένα επιχειρηματικό περιβάλλον.
“Στο Salesforce, ονομάζουμε αυτές τις” βαρετές ανακαλύψεις ” – όχι επειδή δεν είναι αξιοσημείωτες, αλλά επειδή είναι ήρεμα ικανές, αξιόπιστη κλίμακα και δημιουργούνται για υιοθεσία”, δήλωσε ο Silvio Savarze, ο κύριος Satectist Salesforce και ο επικεφαλής της έρευνας τεχνητής νοημοσύνης. “Είναι τόσο ομαλά που μερικοί μπορούν να τους αντιληφθούν ως δεδομένο.”
Επίσης: 4 τύποι ατόμων που ενδιαφέρονται για τεχνητές πράκτορες νοημοσύνης – και ποια επιχείρηση μπορεί να μάθει
Ας βυθίσουμε σε μερικές από τις μεγαλύτερες ανακαλύψεις και συμπεράσματα από την έκθεση.
Πρόβλημα: Σκληρή νοημοσύνη
Εάν χρησιμοποιήσατε κάποτε μοντέλα AI για καθημερινές, απλές εργασίες, μπορείτε να εκπλαγείτε από τη στοιχειώδη φύση ορισμένων από τα λάθη τους. Ακόμη πιο μυστηριώδες είναι ότι το ίδιο μοντέλο που αντιμετώπισε λανθασμένα τα κύρια ζητήματά σας, πραγματοποιήθηκε πολύ καλά σε σύγκριση με τα κριτήρια που έλεγξαν τις ικανότητές τους σε πολύ περίπλοκα θέματα, όπως τα μαθηματικά, το στέλεχος και την κωδικοποίηση. Αυτό το παράδοξο είναι αυτό που το Salesforce ονομάζει “οδοντωτή διάνοια”.
Το Salesforce σημειώνει ότι πρόκειται για “μειονέκτημα” ή μια ασυμφωνία μεταξύ της μη επεξεργασμένης νοημοσύνης LLM και των συνεπών πραγματικών δεικτών, ιδιαίτερα δύσκολων για τις επιχειρήσεις που απαιτούν συνεπείς δείκτες λειτουργίας, ειδικά σε απρόβλεπτα περιβάλλοντα. Παρ ‘όλα αυτά, η λύση στο πρόβλημα σημαίνει ότι αρχικά καθορίζει ποσοτικά, γεγονός που δίνει έμφαση σε ένα άλλο πρόβλημα.
“Το σημερινό AI Zazuben, οπότε πρέπει να εργαστούμε σε αυτό, αλλά πώς μπορούμε να δουλέψουμε σε κάτι χωρίς να το μετρήσουμε στην πρώτη θέση;” Ο Sheinke, ανώτερος διευθυντής έρευνας τεχνητής νοημοσύνης στο Salesforce, δήλωσε στο Sheinke.
Επίσης: Γιατί η παραμέληση της δεοντολογίας του AI είναι μια τόσο επικίνδυνη επιχείρηση – και πώς να κάνει το AI σωστό
Αυτό είναι ακριβώς αυτό που αποφασίζει το νέο Simple Tester Salesforce.
Δοκιμές
Ένα απλό κοινό προσβάσιμο σύνολο δεδομένων Salesforce περιέχει 225 ερωτήσεις επιχειρηματολογίας που είναι απλά για τους ανθρώπους να απαντήσουν, αλλά δύσκολο για το AI, να συγκρίνουν ή να αξιολογούν ποσοτικά από την προβολή του LLM. Για να σας δώσουμε μια ιδέα για το πόσο βασικές είναι οι ερωτήσεις, το σύνολο δεδομένων στα χέρια του προσώπου περιγράφει τα προβλήματα ως “τουλάχιστον το 10% των μαθητών γυμνασίου, στα οποία δίνουν ένα στυλό, απεριόριστο χαρτί και μια ώρα”.
Παρά το γεγονός ότι δεν δοκιμάζει τα καθήκοντα supercomplex, ένα απλό πρότυπο θα πρέπει να βοηθήσει τους ανθρώπους να κατανοήσουν πώς το μοντέλο μπορεί να αιτιολογήσει σε πραγματικές συνθήκες και εφαρμογές, ειδικά κατά την ανάπτυξη της γενικής νοημοσύνης της επιχείρησης (EGI). Αυτά τα αρμόδια συστήματα AI επεξεργάζονται αξιόπιστα επιχειρηματικές εφαρμογές.
Επίσης: το 60% των αντιπροσώπων του AI εργάζονται σε τμήματα πληροφορικής – αυτό είναι που κάνουν κάθε μέρα
Ένα άλλο πλεονέκτημα του προτύπου είναι ότι θα πρέπει να οδηγήσει σε υψηλότερη εμπιστοσύνη στους ηγέτες των επιχειρήσεων σχετικά με την εισαγωγή συστημάτων AI, όπως οι πράκτορες τεχνητής νοημοσύνης, στην επιχείρησή τους, καθώς θα έχουν μια πολύ καλύτερη ιδέα για τη συνέπεια της αποτελεσματικότητας του μοντέλου.
Ένα άλλο πρότυπο που αναπτύχθηκε από το Salesforce είναι ένα συμφραζόμενο συμφραζόμενο συμφραζόμενο, το οποίο χρησιμοποιεί μια διαφορετική προσέγγιση, αξιολογώντας τους δικαστές με υποστήριξη AI και όχι τα ίδια τα μοντέλα. Ατομικά μοντέλα AI χρησιμοποιούν συχνά εκτιμήσεις με άλλα μοντέλα τεχνητής νοημοσύνης. Το Contextualjudgebench επικεντρώνεται στην LLM, η οποία αξιολογεί άλλα μοντέλα με την ιδέα ότι εάν ο εκτιμητής αξίζει την εμπιστοσύνη, οι εκτιμήσεις του θα είναι. Οι δοκιμές ελέγχου υπερβαίνουν τα 2000 ζεύγη απαντήσεων.
Crmarena
Κατά το τελευταίο τρίμηνο, η Salesforce ξεκίνησε τα πλαίσια του πράκτορα Crmarena. Η δομή αξιολογεί τον τρόπο με τον οποίο οι πράκτορες της AI εκτελούν τα καθήκοντα του CRM (διαχείριση των σχέσεων με τους πελάτες), για παράδειγμα, πώς το AI συνοψίζει τα μηνύματα ηλεκτρονικού ταχυδρομείου και το αντίγραφο των πωλήσεων, δίνει συστάσεις για το εμπόριο και πολλά άλλα.
“Αυτοί οι πράκτορες δεν χρειάζεται να λύσουν τα θεωρήματα, δεν χρειάζεται να μετατρέψω την πεζογραφία μου σε ποιήματα του Σαίξπηρ – [they] Είναι απαραίτητο να επικεντρωθούμε σε αυτές τις κρίσιμες ανάγκες της επιχείρησης σε διαφορετικές κατακόρυφες βιομηχανίες “, δήλωσε ο Savers.
Επίσης: Πώς μπορούν οι “πράκτορες του Διαδικτύου” να βοηθήσουν το AIS να συνδεθεί και να συνεργαστεί
Το CRMARENA έχει σχεδιαστεί για να λύσει το πρόβλημα των οργανισμών που δεν γνωρίζουν πόσο καλά εκτελούνται τα μοντέλα σε πρακτικά επιχειρηματικά καθήκοντα. Εκτός από τις πολύπλοκες δοκιμές, η δομή θα πρέπει να συμβάλει στη βελτίωση της ανάπτυξης και της απόδοσης των παραγόντων της ΑΙ.
Άλλες και γνωστές αναφορές
Μια πλήρης έκθεση περιλαμβάνει περαιτέρω έρευνα για την αύξηση της αποτελεσματικότητας και της αξιοπιστίας του μοντέλου AI. Ακολουθεί ένα σούπερ βιογραφικό μερικών από αυτά τα βασικά σημεία:
- SFR-Embedding: Το Salesforce βελτίωσε το μοντέλο ενσωμάτωσης SFR, το οποίο μετατρέπει πληροφορίες κειμένου σε δομημένα δεδομένα για συστήματα AI, όπως παράγοντες. Η εταιρεία πρόσθεσε επίσης το SFR-Embedding-Code, μια εξειδικευμένη οικογένεια μοντέλων μοντέλων.
- SFR-Huard: Η οικογένεια των μοντέλων που εκπαιδεύτηκαν στην αξιολόγηση της αποτελεσματικότητας των παραγόντων της ΑΙ στους κύριους τομείς των επιχειρήσεων, όπως η ανίχνευση της τοξικότητας και της ταχείας έγχυσης.
- Xlam: Το Salesforce ενημέρωσε το οικογενειακό του Xlam (Μοντέλο Μεγάλης Δράσης) με “υποστηρικτικές συνομιλίες με αρκετές στροφές και ένα ευρύτερο φάσμα μικρότερων μοντέλων για την αύξηση της προσβασιμότητας”.
- Tako: Αυτή η πολυτροπική οικογένεια μοντέλων δημιουργεί αλυσίδες σκέψης και δράσης (COTA) για την επίλυση σύνθετων προβλημάτων πολλαπλών σταδίων.