OpenAI continua a sfornare novità, nell'intento di democratizzare sempre di più l'AI generativa. L'azienda ha presentato GPT-4o mini, una versione “minisize" del proprio modello linguistico multimodale di ultima generazione, meno esigente in termini di risorse di calcolo necessarie per l’esecuzione e anche meno costosa. Per una volta l’azienda di Sam Altman non fa da apripista ma segue l’esempio di Microsoft, Meta, Google e Anthropic, che già includono nella propria offerta dei modelli di dimensioni ridotte, più economici ma anche più facili da gestire. “Ci aspettiamo che GPT-4o amplierà in modo significativo il ventaglio di applicazioni create con l’AI, rendendo l’intelligenza molto più accessibile”, ha scritto l’azienda. “Immaginiamo un futuro in cui i modelli saranno integrati armonicamente in ogni app e sito Web”.
L’utilizzo di GPT-4o mini comporta una spesa di 15 centesimi di dollaro per milioni di token di input e di 60 centesimi per milione di token di output, risultando così più conveniente del 60% rispetto a GPT-3.5 Turbo. Inoltre il modello supera GPT-4 in prestazioni e ha ottenuto un punteggio di 82% nel Massive Multitask Language Understanding, benchmark che misura la comprensione linguistica e di ragionamento degli algoritmi di intelligenza artificiale. Un punteggio superiore a quello di altri modelli “mini”, come Gemini Flash (di Google, ha ottenuto il 77,9% nello stesso benchmark) e Claude Haiku (di Anthropic, 73,8%).
OpenAI ha definito questo nuovo prodotto come “il modello di piccole dimensioni più abile e conveniente” tra quelli attualmente disponibili. Al momento GPT-4o mini può gestire input e output di testo e immagini, ma in un secondo momento saranno integrate capacità multimodali per video e audio. La base di conoscenza usata per il training arriva fino a ottobre 2023.
Gli sviluppatori hanno lavorato anche per potenziare la sicurezza del modello, che impiega le stesse misure di mitigazione di GPT-4o e che come quest’ultimo è stato valutato dal punto di vista dei rischi non solo con tecnologie automatiche ma anche da decine di esperti (una settantina). Inoltre all’interno dell’Api di GPT-4o mini per la prima volta è stato usato un metodo di prioritizzazione delle istruzioni (instruction hierarchy) che migliora la capacità del modello di resistere a jailbreak e tentativi di manomissione dei prompt.
Gli utenti di ChatGPT nelle versioni Free, Plus e Team possono già accedere a GPT-4o mini sia tramite browser sia tramite app, usando questo modello anziché GPT-3.5 Turbo, mentre per le aziende sarà disponibilie la settimana prossima.