Nel panorama dell’intelligenza artificiale enterprise, uno dei problemi più evidenti riguarda la cosiddetta “intelligenza irregolare”: modelli capaci di risolvere compiti avanzati ma sorprendentemente inaffidabili quando si trovano davanti ad attività semplici. È una fragilità che nelle aziende genera rischi reali, soprattutto quando gli agenti AI gestiscono operazioni sensibili come la customer experience, i flussi di vendita o le comunicazioni in ambito sanitario. Salesforce AI Research propone come soluzione il suo eVerse, un ambiente simulato progettato per migliorare affidabilità, coerenza e sicurezza degli agenti vocali e testuali a livello enterprise. L’approccio introduce un ciclo scientifico continuo basato su generazione di dati sintetici, misurazione delle performance e ottimizzazione comportamentale, con l’obiettivo di trasformare modelli linguistici generici in sistemi robusti e realmente pronti alla produzione.
Il simulatore che porta gli agenti oltre l’hype
eVerse è nato come risposta diretta alla crescente domanda di agenti vocali affidabili, in particolare in un mercato dove oltre il settanta per cento delle interazioni con i clienti continua a partire da una telefonata. Nonostante la digitalizzazione dei canali, il contatto vocale rimane il punto di riferimento quando gli utenti cercano chiarezza, velocità e certezza nella risoluzione di un problema, ma restano spesso delusi quando trovano dall’altra parte una voce robotica dalle prestazioni poco brillanti. L’ambiente di simulazione di Salesforce promette un salto di qualità in quest’ambito perché permette di testare gli agenti sviluppati con Agentforce Voice in migliaia di scenari vocali generati artificialmente: comunicazioni disturbate, accenti diversi, rumori di fondo, dialoghi contraddittori, errori di riconoscimento e tutte le variabili tipiche delle conversazioni del mondo reale.
Il paragone scelto dai ricercatori è eloquente: come un pilota professionista migliora le proprie prestazioni grazie ai simulatori, così un agente AI affina capacità e riflessi linguistici grazie all’addestramento immersivo in eVerse. Prima del lancio sul mercato, Agentforce Voice ha superato migliaia di sessioni simulate che hanno permesso ai team di ingegneria di individuare rapidamente incongruenze, risolvere comportamenti disallineati e raggiungere il livello di coerenza necessario per gli standard enterprise.
L’AI che apprende dai contesti reali: il caso UCSF Health
Uno degli esempi più interessanti di applicazione operativa di eVerse arriva dal settore sanitario. Presso UCSF Health è in corso una sperimentazione per addestrare agenti AI dedicati alla semplificazione della fatturazione medica, un processo altamente regolamentato e complesso. Il sistema utilizza un motore di apprendimento continuo alimentato da feedback umani raccolti direttamente nei flussi di lavoro clinici, consolidando automaticamente i comportamenti corretti e adattandosi progressivamente alle eccezioni.
I primi risultati sono significativi: retention delle conoscenze (le informazioni imparate dal sistema che vengono mantenute e riutilizzate correttamente) intorno al settanta per cento e capacità di generare nuovi casi con un tasso superiore al sessanta per cento. Sono indicatori che suggeriscono un percorso solido verso agenti specializzati, capaci di migliorare l’efficienza senza introdurre rischi operativi.
Il cuore di eVerse è un processo ciclico che porta gli agenti a un livello di maturità superiore: configurazione dell’ambiente, stress test con dati sintetici, misurazione delle prestazioni, riallineamento fine del comportamento. Ripetuto nel tempo, questo metodo permette agli agenti di abbandonare la logica generalista dei modelli linguistici di base per diventare strumenti specializzati, adattati alle regole, agli standard e alle eccezioni del settore in cui operano. La continuità tra sperimentazione e produzione è uno degli elementi distintivi della piattaforma, perché riduce il divario tra ricerca e applicazioni enterprise, garantendo un comportamento stabile anche in condizioni operative imprevedibili.