08/08/2025 di redazione

OpenAI al punto di svolta con Gpt-5: più intelligente, sicuro e sincero

L’azienda ha lavorato sulla capacità di ragionamento, sulla sicurezza, sulla riduzione delle “allucinazioni” e dell’adulazione. ChatGPT Pro può ora collegarsi a Gmail.

GPT-5-novita-chatgpt-openai.jpg

Migliore in tutto: con GPT-5, OpenAI è convinta di aver fatto passi da giganti con quello che è “il miglior sistema di intelligenza artificiale che abbiamo mai realizzato” e “in assoluto il nostro modello più intelligente, veloce ed efficace, con capacità di ragionamento integrata”. GPT‑5 segna un “significativo avanzamento in termini di intelligenza rispetto a tutti i nostri modelli precedenti, con prestazioni all'avanguardia in ambiti quali programmazione, matematica, scrittura, salute, percezione visiva e altro ancora”. 

Il roll-out è cominciato per tutti gli utenti Plus, Pro, Team e Free, mentre l’accesso per le versioni Enteprise e Edu è previsto a breve, con distribuzione dalla metà di agosto. Gli abbonati Pro avranno anche accesso a GPT-5 Pro, una versione con ragionamento esteso, che produce output ancora più dettagliati e accurati. OpenAI sottolinea che per la prima volta anche la versione gratuita di ChatGPT permette di accedere a un modello di ragionamento, pur con limiti di utilizzo.

Oltre ai tanti miglioramenti racchiusi in GPT-5, la società di Sam Altiman ha fatto sapere che stanno per debuttare ulteriori capacità, come le “personalità” del modello e il collegamento a Gmail. Ma andiamo con ordine.

Un sistema unificato

Questa novità arriva in un momento in cui  ChatGPT ha superato i 700 milioni di utenti settimanali, mentre le diverse versioni a pagamento hanno raggiunto i 5 milioni di utenti. Sono più di 4 milioni gli sviluppatori che finora hanno programmato sulla piattaforma API di OpenAI.

GPT-5 si basa su anni di progressi compiuti dagli sviluppatori di OpenAI nel ragionamento artificiale, nella multimodalità e nella sicurezza dell’intelligenza artificiale. Si tratta non di un semplice Large Language Model ma di un “sistema unificato”: integra, infatti, due modelli sottostanti che si attivano in automatico, a seconda del tipo di richiesta e degli strumenti a disposizione, oppure possono essere selezionati dall’utente. Il modello di base può rispondere alla “maggior parte delle domande”, ha spiegato OpenAI, in modo rapido ed efficiente, mentre il modello di ragionamento più profondo, GPT‑5 thinking, gestisce i problemi particolarmente complessi

Il sistema riconosce autonomamente se è necessaria una risposta più lunga e articolata: qui entra in gioco un router (terzo elemento del sistema unificato) che in tempo reale valuta la richiesta e decide quale modello ingaggiare. Il router considera il tipo di conversazione, la difficoltà di risposta, gli strumenti software necessari per generarla e anche alcune indicazioni linguistiche contenute nel prompt (che possano suggerire la necessità di un ragionamento lungo). “Il router viene continuamente addestrato su segnali reali, inclusi i casi in cui gli utenti cambiano modello, i tassi di preferenza per le risposte e la correttezza misurata, migliorando nel tempo”, ha spiegato OpenAI. Una volta raggiunti i limiti di utilizzo, una versione mini di ciascun modello gestisce le query rimanenti. 

GPT-5-coding.jpg

Le capacità di GPT‑5

I ricercatori e gli sviluppatori di OpenAI hanno lavorato su diversi fronti per migliorare sia le abilità, sia l’affidabilità e la sicurezza rispetto a quanto già ottenuto con GPT-o3 e GPT-o4. Secondo le valutazioni di OpenAI, le prestazioni di GPT‑5 con funzione di ragionamento sono superiori a quelle di OpenAI o3, con una riduzione del 50-80% dei token di output in tutte le funzionalità, tra cui ragionamento visivo, codifica agentica e risoluzione di problemi scientifici di livello universitario.

GPT‑5 è “molto più intelligente sotto tutti i punti di vista”, afferma l’azienda, citando i punteggi di alcuni benchmark su capacità di matematica (94,6% su AIME 2025 senza strumenti), programmazione nel mondo reale (74,9% su SWEBench, 88% su Aider-Polyglot), comprensione multimodale (84,2% su MMMU) e risposte a domande riguardanti la salute (46,2% su HealthBench Hard), ovvero una delle principali ragioni per cui i chatbot vengono quotidianamente consultati. Grazie al ragionamento esteso di GPT‑5 Pro, inoltre, è stato toccato un nuovo record SOTA su GPQA, con un punteggio dell'88,4% senza strumenti.

Nella pratica, il progresso rispetto a precedenti modelli è evidente nella scrittura di testi, e in particolare negli aspetti stilistici e nella capacità di produrre contenuti di specifiche tipologie, in prosa e in versi. Inoltre GPT-5 è più abile nella comprensione di immagini fotografiche, grafici e altri prompt non testuali.

Anche nelle capacità di coding c’è stato un notevole passo in avanti, in particolare per quanto riguarda la generazione di front-end complessi e il debug di repository di grandi dimensioni. Può bastare anche un singolo solo prompt per creare siti Web, app e interfacce grafiche di videogiochi dotate anche di una certa qualità estetica.

Più sicurezza, meno allucinazioni e adulazione

Nel complesso, GPT‑5 è “meno espansivo e accondiscendente, utilizza meno emoji superflue ed è più sottile e attento nei follow-up” rispetto a GPT‑4o. L'utente non avrà più la sensazione di parlare con un chatbot, ma piuttosto di “chiacchierare con un amico disponibile dotato di un'intelligenza pari a quella di un dottore di ricerca”, a detta di OpenAI.

La sicurezza rimane un tema critico, sempre più critico anzi, al progredire delle capacità dei sistemi di AI e con la prospettiva di arrivare a una Artificial General Intelligence nei prossimi anni. A San Francisco si è lavorato su questo fronte correggendo le tecniche di addestramento, non più soltanto incentrate sui meccanismi di rifiuto che il modello deve attivare di fronte alle richieste “non sicure” (per esempio riguardanti attività illegali, violazioni di copyright o cybercrimine). “Questo tipo di addestramento funziona bene per prompt esplicitamente dannosi, ma può risultare difficile da gestire quando l'intenzione dell'utente non è chiara o le informazioni potrebbero essere usate in modo innocuo o dannoso”, ha spiegato OpenAI. Dunque è stata introdotta una nuova tecnica di training che insegna al modello a fornire la risposta più utile ove possibile, rimanendo però entro i limiti di sicurezza. In alcuni casi, quindi,  GPT‑5 potrebbere rispondere a una domanda solo in parte o in modo generico, mentre se si rifiuta di fornire informazioni ne spiegherà il motivo.

OpenAI ha prestato particolare attenzione al tema dei rischi biologici connessi all’intelligenza artificiale, di cui si discute negli ultimi anni: il pericolo che un’AI possa fornire informazioni dettagliate per creare armi biologiche o agenti patogeni per scatenare epidemie, per esempio.  Quindi l'addestramento al rifiuto è stato particolarmente rigido per i dati e le domande che riguardano quest’ambito. La “modalità di pensiero GPT‑5” include quello che OpenAI definisce un “sistema di difesa multilivello per la biologia”, con “modellazione completa delle minacce, addestramento a non produrre contenuti dannosi attraverso il nuovo paradigma di completamenti sicuri, classificatori e monitor di ragionamento sempre attivi e pipeline di applicazione chiare”.

Oltre a essere più attento alla sicurezza, GPT‑5 è decisamente meno incline alle allucinazioni rispetto a modelli precedenti.  “Sui prompt rappresentativi del traffico di produzione di ChatGPT, GPT‑5 commette circa il 20% di errori fattuali in meno rispetto a GPT‑4o, mentre quando ragiona, GPT‑5 commette circa il 70% di errori fattuali in meno rispetto a OpenAI o3”, ha illustrato OpenAI. Nel rispondere a domande complesse e aperte, la “modalità di pensiero GPT‑5” mostra un netto calo delle allucinazioni, circa sei volte meno rispetto a GPT-o3, e può quindi produrre contenuti lunghi costantemente accurati.

Un altro problema affrontato dai ricercatori di OpenAI è la tendenza dei modelli di intelligenza artificiale a rispondere sempre, anche a costo di fornire risposte errate o inventate. Lavorando sull’addestramento del modello, si è fatto in modo che GPT‑5 riconosca con più precisione i casi in cui non può soddisfare completamente una richiesta: in quel caso, il chatbot comunica chiaramente i propri limiti.  OpenAI ammette che c’è ancora da lavorare sulla questione dell’accuratezza e della sincerità dei modelli di intelligenza artificiale. Ma i progressi ci sono: il tasso di inganno è stato più che dimezzato, dal 4,8% di GPT-o3 al 2,1% delle risposte ragionate di GPT‑5.

Si è lavorato anche per ridurre la tendenza all’adulazione, un problema associato a molti modelli di AI e che può essere semplicemente stucchevole o anche pericolosa (per esempio se si creano delle dipendenze emotive fra persone e AI o se viene assecondata una volontà suicidaria dell’utente, e purtroppo è successo). Un aggiornamento rilasciato all’inizio di quest'anno aveva reso GPT‑4o più “lusinghiero” o “compiacente”, e dunque OpenAI si era affrettata ad annullare la modifica. GPT-5 segna un miglioramento anche in questa direzione.

gpt-5-chatgpt-sincerita.jpg

LE PERSONALITà Di GPT-5 e il collegamento con Gmail

GPT-5 introduce anche diverse “personalità” in ChatGPT, o meglio lo farà a breve, perché questa funzionalità è al momento disponibile solo come anteprima di ricerca e unicamente nella chat testuale, mentre prossimamente arriverà anche in quella vocale. Per personalizzare lo stile di risposta del chatbot sarà possibile, ma non obbligatorio, scegliere tra quattro profili: cinico e sarcastico (Cynic), conciso e professionale (Robot), attento e collaborativo (Listener) e il nerd (Nerd). In qualsiasi momento si potrà disattivare l’opzione o passare a un altro profilo.

C’è un’altra innovazione importante, specie per l’uso di Chat-GPT per attività di lavoro: il collegamento diretto a Gmail, Google Calendar e Google Contacts. Una volta abilitati i collegamenti a queste applicazioni, ChatGPT riconoscerà automaticamente quando è più opportuno farvi riferimento, così che non sarà necessario selezionarli prima di iniziare la conversazione. Questa funzionalità sarà disponibile dalla metà di agosto in Chat-GPT Pro, e intanto OpenAI ha anticipato che ci saranno presto altre integrazioni con applicazioni terze.

scopri altri contenuti su

ARTICOLI CORRELATI