Il divario linguistico dell'intelligenza artificiale si sta colmando, ma le prestazioni cambiano da una versione all'altra dei modelli, avverte lo studio di TrainAI di RWS

I risultati evidenziano che le strategie di successo nell'ambito dell'intelligenza artificiale aziendale richiedono una continua convalida basata su dati di alta qualità e ricchi di sfumature culturali

Maidenhead, Regno Unito
4/13/2026 9:00:00 AM
Report on glass desk

RWS (RWS.L), azienda globale di soluzioni di intelligenza artificiale, ha reso noti oggi i risultati del suo ultimo studio sulla generazione di dati sintetici degli LLM multilingue di TrainAI (TrainAI Multilingual LLM Synthetic Data Generation Study), dai quali emerge che, sebbene i principali modelli linguistici di grandi dimensioni (LLM) stiano colmando il divario linguistico globale, le loro prestazioni da una generazione di modelli all'altra possono essere imprevedibili. 

I risultati sottolineano la necessità di una valutazione continua condotta da esperti per garantire che le aziende selezionino il modello giusto per le loro specifiche esigenze aziendali.

Una riduzione del divario linguistico globale è uno dei risultati più significativi emersi dallo studio. La ricerca mostra che il divario di prestazioni tra lingue ampiamente supportate come l'inglese e quelle sottorappresentate si è ridotto notevolmente. Pur osservando una tendenza diffusa nel settore verso il miglioramento linguistico, con modelli come GPT e Claude Sonnet che mostrano progressi significativi, la ricerca ha evidenziato le prestazioni eccezionali di Gemini Pro di Google. Ha ottenuto punteggi molto elevati (oltre 4,5 su 5) in Kinyarwanda, una lingua in cui le precedenti generazioni di modelli faticavano a produrre testo coerente.
Woman looking at digital screen
Vasagi Kothandapani

"Questo studio segna un momento di svolta che non mira a sostituire la competenza umana, ma a valorizzarla grazie alla giusta tecnologia. Man mano che l'intelligenza artificiale diventa più abile in tutte le lingue, la necessità di un'intelligenza culturale profonda e della convalida umana è più essenziale che mai. Ecco perché RWS sta guidando le aziende in questa nuova realtà integrando queste potenti tecnologie nei flussi di lavoro dei contenuti con un approccio "expert-in-the-loop", per garantire precisione, pertinenza culturale e coerenza del marchio su scala globale."

Vasagi Kothandapani, CEO, TrainAI di RWS
LLM chip
Lo studio ha inoltre messo in luce un aspetto importante di cui le aziende devono tenere conto: il progresso dell'intelligenza artificiale non è necessariamente lineare. La ricerca ha identificato una "deriva rispetto al benchmark", in cui le funzionalità degli LLM possono cambiare in modo imprevisto da una versione all'altra. Ad esempio, lo studio ha rilevato che l'ultima versione di GPT ha ottenuto risultati inferiori rispetto a modelli più piccoli in diverse attività di generazione di contenuti, dove il suo predecessore era stato competitivo.
 
Anche le metriche principali, come l'efficienza dei tokenizzatori che influisce sui costi, presentavano notevoli differenze tra le diverse generazioni di modelli. Lo studio mostra che gli aggiornamenti dei modelli modificano in modo imprevedibile i punti di forza e i punti deboli, rafforzando la necessità di rivalutare anche le famiglie di modelli noti ad ogni nuova release.
Tomáš Burkert

"Il valore reale di un modello spesso dipende da metriche specifiche e spesso trascurate. Fattori come l'efficienza dei tokenizzatori, che può rendere un modello 3,5 volte più conveniente di un altro in determinate lingue, sono fondamentali. La base di una strategia di intelligenza artificiale di successo è un processo di convalida continuo, basato su dati di intelligenza artificiale di alta qualità e ricchi di sfumature culturali, per garantire l'adozione del modello ottimale per soddisfare i requisiti specifici della vostra azienda."

Tomáš Burkert, Head of Innovation, TrainAI di RWS
Lo studio conclude che, dato il rapido evolversi del panorama dell'intelligenza artificiale, le aziende devono andare oltre le classifiche pubbliche ed eseguire una valutazione continua e indipendente ad ogni nuova versione del modello, per garantire che sia ancora la scelta giusta per il loro specifico caso di utilizzo dell'intelligenza artificiale.
 
Fate clic qui per scaricare il report completo TrainAI Multilingual LLM Synthetic Data Generation Study 2.0.
Desk with report and digital screen