“È il primo passo verso un nuovo Rinascimento Digitale” – .

“È il primo passo verso un nuovo Rinascimento Digitale” – .
“È il primo passo verso un nuovo Rinascimento Digitale” – .

iGeniusl’azienda deep-tech che sviluppa tecnologie di intelligenza artificiale fondata da Uljan Sharkaregali ‘Italia’il Large Language Model (LLM) formato con fonti native in italiano, rilasciato Open Source sotto licenza MIT.

‘Italia’ è un modello linguistico sviluppato in conformità con le normative europee sull’intelligenza artificiale. È progettato per aiutare le aziende ad adottare l’intelligenza artificiale generativa in settori altamente regolamentati, come i servizi finanziari, l’industria e la pubblica amministrazione.

La formazione di ‘Italia’ continuerà anche dopo questa prima release, iGenius sta lavorando su nuove versioni ancora più potentiaccurato e versatile, oltre ad una versione multilingue.

Sviluppato in 5 mesi, addestrato dal supercomputer Leonardo

Il modello era sviluppato in 5 mesi dai membri del team iGeniusche opera nel campo dei modelli linguistici dal 2016, ed è stato addestrato sul supercomputer Leonardouna delle infrastrutture informatiche più potenti al mondo, gestita dal Consorzio Interuniversitario Cineca.

anche iGenius ha collaborato con Editoriale Nazionale, società del gruppo Monrif, di utilizzare il proprio archivio storico di articoli di stampa come fonte integrativa per migliorare il modello. Questa collaborazione proseguirà con la formazione delle future versioni di ‘Italia’, per ampliare ulteriormente il livello generale di conoscenza del modello.

‘Italia’ è stato addestrato da zero in italiano oltre un trilione di parole, utilizzando un mix diversificato di fonti: fonti pubbliche, dati sintetici e contenuti di settore forniti da partner commerciali iGenius selezionati.

Per garantire l’integrità etica dei contenuti generati dal modello, sono state sviluppate delle linee guida filtri di sicurezza specifici per la lingua italianaprogettato per rimuovere contenuti sensibili, espliciti e potenzialmente distorti, nonché per limitare il più possibile l’esposizione di contenuti protetti da copyright.

Un Tokenizer proprietario per elaborare e generare token in italiano

La prima versione di “Italia” è un LLM fondazionale con un’architettura Transformer da 9 miliardi di parametri, una finestra di contesto da 4.096 token e un vocabolario da 50.000 token. Rispetto ad altri modelli linguistici si distingue per l’efficacia nella gestione delle parole italiane.

Grazie ad un Tokenizer proprietario, sviluppato dal team iGenius appositamente per questo modello, ‘Italia’ è in grado di elaborare e generare token in italiano con prestazioni equivalenti ad un aumento del 60% nella sua finestra di contesto. Ciò si traduce direttamente in una notevole efficienza in termini di costi e risorse necessarie al servizio del modello, aspetto essenziale per una soluzione di intelligenza artificiale pensata per il mondo aziendale.

Verso un nuovo Rinascimento Digitale

“La decisione di sviluppare l’Italia come modello open source riflette pienamente la nostra missione di umanizzare i dati e democratizzare la conoscenza aziendale. Crediamo che l’Italia rappresenti il ​​primo passo verso un nuovo Rinascimento Digitale, in cui le soluzioni AI sono progettate mettendo al centro le persone, non la tecnologia. Ora il nostro obiettivo è investire in nuovi modelli che siano rappresentativi di altre lingue e culture. Stiamo lavorando per rilasciare presto una versione dell’Italia con 10 miliardi di parametri e, successivamente, una versione multilingue”, spiega in una nota Uljan SharkaFondatore e CEO di iGenius.

“Un’azienda italiana, con un progetto innovativo e molto interessante, ha avuto l’opportunità di accedere alla potenza di calcolo di Leonardo, uno dei supercomputer più avanzati al mondo: tutto ciò a conferma del ruolo del Cineca come abilitatore dell’innovazione digitale e della competitività del Paese. La nostra infrastruttura, pubblica e aperta per definizione, trova in questa avventura una delle sue espressioni meno evidenti, ma sicuramente più coerenti con la volontà di progettare il futuro, innovando e generando valore per la nostra comunità”, ha sottolineato Alessandra PoggianiDirettore Generale del Cineca.

“Italia” lo è scaricabile sul sito iGenius e, a breve, sarà disponibile anche su Hugging Face e sulle principali piattaforme di sviluppo di prodotti AI, come Model Catalogs o AI Studios.

 
For Latest Updates Follow us on Google News
 

PREV L’intervista, Riccardo Berni e l’Argentario casalingo – Grosseto Sport – .
NEXT In Piemonte, nei primi 3 mesi del 2024, sono spariti nove negozi al giorno – .