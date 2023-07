GPT-4 al debutto, un modello multimodale e più difficile da ingannare Il nuovo modello per l’AI generativa di OpenAI è in disponibilità generale. A differenza di GPT-3.5, oltre ai prompt testuali accetta anche immagini e sa ragionare in modo più raffinato. Pubblicato il 10 luglio 2023 da Redazione

L’intelligenza artificiale generativa fa rapidi progressi e uno dei suoi frutti più recenti e più “maturi” è GPT-4: il più avanzato tra i modelli linguistici di grandi dimensioni di OpenAI passa alla disponibilità generale. Si tratta dell’evoluzione di GPT-3.5, il modello alla base della versione gratuitamente disponibile (e già integrata in molti software commerciali) di ChatGPT. I clienti paganti di ChatGPT Plus possono ora mettere le mani su GPT-4 con un tetto massimo di utilizzo, mentre per gli sviluppatori già c’è una lista d’attesa a cui è possibile registrarsi per accedere all’API del modello.

Come funziona GPT-4? La principale differenza rispetto alla versione 3.5 è che questo Generative Pre-trained Transformer (da cui l’acronimo Gpt) può generare testo e codice software a partire da prompt o altri input di natura testuale ma anche a partire da immagini. In sintesi, è non solo un modello linguistico testuale bensì un modello multimodale.

Ma non è questo l’unico progresso ottenuto con mesi di lavoro di allenamento e perfezionamento. OpenAI ha addestrato il programma utilizzando dati pubblicamente disponibili (tra cui pagine Web) e altri su cui l’azienda ha acquisito diritti, ma anche i prompt inseriti dagli utenti nell’app di ChatGPT. Non è dato sapere quanti siano i miliardi di parametri che GPT-4 sa gestire, ma sono sicuramente molti più dei 175 miliardi gestiti da GPT-3.5.



Questo si traduce in una complessiva capacità di “ragionamento” più evoluta, più vicina a quella del cervello umano. Il software quindi comprende meglio le sfumature di significato, sa analizzare meglio il contesto e produce risposte più “creative”. “In una conversazione superficiale, la differenza tra GPT-3.5 e GPT-4 può essere sottile”, ha spiegato OpenAI. “La differenza emerge quando la complessità della richiesta supera una certa soglia: GPT-4 è più affidabile, più creativo e capace di gestire le istruzioni con molte più sfumature”.



Inoltre, essendo stato addestrato sui prompt che gli utenti hanno proposto a ChatGPT per mesi, il nuovo modello ha imparato a non farsi ingannare da richieste maliziose o provocatorie. Di fronte a domande problematiche dal punto di vista della legalità, della sicurezza o dell’etica (per esempio, una richiesta di istruzioni su come costruire un’arma o su come fare del male a sé stessi), il software non soddisfa la richiesta spiegando il perché. OpenAI ha ammesso che è ancora possibile, in qualche caso, ingannare il programma, ma i miglioramenti rispetto a GPT-3.5 sono sensibili.





(Immagine di Pixabay; immagine in apertura tratta da Freepik)



Altri progressi riguardano le performance tecniche: GPT-4 ha una memoria più estesa (su circa 64mila parole, anziché le ottomila ricordate da GPT-3.5) ed è più abile nel lavoro di riduzione dei bug di codice.

Abbiamo detto che GPT-3.5 è il modello utilizzato in molti prodotti commerciali, come software per aziende in cui sono state integrate funzionalità di AI generativa. In realtà Microsoft, in quanto principale investitore di OpenAI, ha con l’azienda di San Francisco un rapporto privilegiato e quindi ha già potuto utilizzare GPT-4 in anticipo su tutti all’interno del motore di ricerca Bing. Altre aziende che già utilizzano il più recente modello di OpenAI sono Stripe, Morgan Stanley, Duolingo, il governo islandese (per un progetto di tutela della lingua tradizionale), Yabble, Waymark e Inworld AI.