Le notizie più significative della settimana sulla Gen AI tracciano un panorama ricco di trasformazioni strategiche, accelerazioni tecnologiche e nuove frontiere applicative. Dalla spinta verso l’autonomia hardware in Cina alla rivoluzione del DNA come supporto di archiviazione, passando per sperimentazioni umane con l’AI in azienda, diagnosi mediche super-accurate, creatività computazionale e modelli open-source che sfidano i giganti statunitensi: l’ecosistema dell’intelligenza generativa si evolve su più assi, con implicazioni che toccano sanità, industria, geopolitica e cultura del lavoro. Le notizie selezionate mostrano quanto velocemente il settore stia ridefinendo i propri confini operativi e cognitivi.
-
In un contesto di restrizioni internazionali sui chip ad alte prestazioni, Ant Group realizza un significativo balzo in avanti sfruttando semiconduttori cinesi per addestrare grandi modelli linguistici. Riducendo i costi del 20% grazie all’adozione dell’architettura Mixture of Experts e dichiarando benchmark competitivi rispetto ai modelli di Meta e DeepSeek, l’azienda dimostra una nuova capacità di innovazione locale. Con l’apertura dei suoi modelli Ling-Plus e Ling-Lite, Ant Group punta all’autosufficienza tecnologica e alla penetrazione in settori chiave come finanza e sanità. Il progetto è parte di una strategia più ampia che mira a rafforzare la resilienza digitale della Cina. Il traguardo raggiunto non è solo tecnico ma anche geopolitico, sottolineando come la spinta all’indipendenza nei componenti hardware possa produrre avanzamenti sorprendenti anche in assenza delle tecnologie occidentali. I modelli sono stati resi open-source, e applicazioni reali sono già previste grazie all’acquisizione della piattaforma medica Haodf.com. Se confermati da valutazioni indipendenti, i risultati ottenuti da Ant Group ridefiniscono le capacità locali nell’addestramento di LLM ad alte prestazioni. Per approfondire clicca qui
-
L’archiviazione molecolare dei dati compie un salto notevole grazie a un nuovo metodo sviluppato dal Technion israeliano. Il sistema, chiamato DNAformer, sfrutta un modello transformer per recuperare file da supporti in DNA con una velocità 3.200 volte superiore agli approcci tradizionali. Oltre alla rapidità, migliora la precisione fino al 40%, affrontando efficacemente errori comuni come inserzioni, cancellazioni e mutazioni. Questo sistema potrebbe cambiare radicalmente la gestione di archivi ad altissima densità e lunga durata, superando i limiti ambientali ed energetici dei data center. In dieci minuti, DNAformer riesce a leggere 100 MB di dati da sequenze sintetiche, dimostrando la fattibilità dell’approccio con test reali che includono immagini, tracce audio e dati casuali. L’impiego dell’AI permette di ricostruire le informazioni in modo efficiente, con la prospettiva futura di applicazioni commerciali scalabili. La combinazione di deep learning e biotecnologia apre scenari inediti per il data storage del futuro: dai backup istituzionali agli archivi di lungo termine per banche dati scientifiche e culturali. I ricercatori prevedono lo sviluppo di versioni adattate del modello per diversi mercati verticali, accelerando il passaggio dal laboratorio all’industria. Si tratta di un raro esempio in cui la Gen AI agisce direttamente sulla fisicità del dato. Per approfondire clicca qui
-
Nvidia espande la sua supremazia nel settore AI presentando Dynamo, un framework che funge da “sistema operativo” per la fabbrica di intelligenza artificiale. Progettato per ottimizzare il processo di inferenza su larga scala, Dynamo bilancia in tempo reale le operazioni di input e generazione dei token su più GPU, moltiplicando la velocità e l’efficienza. Grazie a sistemi di routing intelligente e a una gestione avanzata della memoria, il framework migliora il throughput e massimizza il riutilizzo delle cache. I primi benchmark indicano un raddoppio delle prestazioni su sistemi Hopper e un aumento di 30 volte nella generazione di token sui nuovi Blackwell NVL72. Compatibile con le librerie PyTorch e vLLM, ma esclusivo per le GPU Nvidia (dalla serie Ampere in poi), Dynamo è disponibile come container NIM e su GitHub, posizionandosi subito come strumento chiave per i professionisti che operano con modelli LLM. Il framework non si limita all’ottimizzazione: propone un nuovo standard operativo per ambienti AI distribuiti, con un’attenzione specifica all’inferenza eterogenea. Nvidia continua così a consolidare la propria infrastruttura AI, spingendosi sempre più verso una verticalizzazione totale che unisce hardware, software e orchestrazione computazionale. Per approfondire clicca qui
-
Un esperimento sul campo condotto su 776 professionisti di Procter & Gamble indaga l’impatto reale dell’AI generativa sulla collaborazione aziendale. Utilizzando GenAI durante la fase di sviluppo di nuovi prodotti, i partecipanti hanno raggiunto performance paragonabili a quelle di team di due persone senza AI, suggerendo che l’intelligenza artificiale possa emulare alcune dinamiche di cooperazione umana. Il supporto dell’AI ha abbattuto le barriere tra funzioni aziendali e stimolato risposte emotive positive, come entusiasmo e motivazione, migliorando anche il benessere percepito. Tuttavia, i partecipanti tendevano a sottovalutare la qualità del lavoro svolto con AI, evidenziando un disallineamento tra percezione e risultati oggettivi. Lo studio pone interrogativi su come ripensare il design dei team e la distribuzione delle competenze in azienda, ipotizzando nuovi modelli di collaborazione ibrida uomo-AI. Il concetto di “compagno cibernetico” emerge con forza: un’entità non solo produttiva ma anche catalizzatrice di energia e interazione tra colleghi. Questo scenario apre alla possibilità di ridefinire ruoli e dinamiche nei gruppi di lavoro, offrendo strumenti per superare silos funzionali e rigidità organizzative. Le implicazioni vanno ben oltre la produttività: toccano cultura aziendale, fiducia, autoefficacia e processi di apprendimento. Per approfondire clicca qui
-
DeepSeek irrompe sulla scena globale con il modello V3, capace di operare su hardware consumer – come un Mac Studio – a velocità sorprendenti: 20 token al secondo con un consumo di soli 200 watt. Questo è possibile grazie all’architettura mixture-of-experts, che attiva solo una frazione dei 685 miliardi di parametri totali. Il risultato è un modello scalabile, efficiente e altamente accessibile. Le nuove tecniche MLA e MTP migliorano ulteriormente la rapidità e la precisione delle generazioni testuali. Reso open-source sotto licenza MIT, DeepSeek-V3 ha già superato modelli commerciali di fascia alta come Claude Sonnet 3.5. Il modello non è solo tecnologicamente rilevante, ma anche strategicamente disruptive: propone un paradigma alternativo all’approccio chiuso di OpenAI e Anthropic, favorendo la diffusione orizzontale e la sperimentazione pubblica. La scelta di aprire il codice riflette una filosofia più collaborativa, potenzialmente accelerando l’adozione in mercati emergenti e rafforzando l’indipendenza tecnologica di sviluppatori locali. È atteso a breve anche il lancio della versione DeepSeek-R2, pensata per il ragionamento complesso. Il caso DeepSeek mostra come anche startup extra-occidentali possano ridefinire gli standard globali e mettere sotto pressione i colossi del settore. Per approfondire clicca qui
-
Una collaborazione tra università in Bangladesh, Australia e Canada ha portato allo sviluppo di ECgMPL, un modello AI per la diagnosi di tumori ginecologici con un’accuratezza del 99,26%. Analizzando immagini istopatologiche, il modello individua zone critiche con efficienza superiore rispetto a soluzioni attualmente impiegate. Le tecniche di auto-attenzione e gli studi di ablazione hanno permesso di ottimizzare il sistema, rendendolo anche adatto a riconoscere altre forme tumorali, come il cancro al seno e al colon-retto, con tassi di precisione sopra il 97%. Il progetto dimostra come l’intelligenza generativa possa supportare decisioni cliniche, riducendo tempi e margini di errore. Oltre all’eccellenza tecnica, ECgMPL si distingue per la collaborazione internazionale e l’approccio open alla ricerca. Il modello promette un’integrazione fluida nei sistemi informativi sanitari, contribuendo a democratizzare l’accesso a diagnosi rapide e affidabili. Il potenziale va oltre la ginecologia: le performance registrate su più set di dati suggeriscono un utilizzo trasversale anche in ambiti oncologici complessi. Un’applicazione concreta e vitale della GenAI che potrebbe rivoluzionare il supporto clinico in contesti ad alta pressione diagnostica. Per approfondire clicca qui
-
Midjourney, noto per la generazione di immagini AI, sorprende con una nuova ricerca sulla creatività nei modelli linguistici. In collaborazione con la New York University, introduce due tecniche originali: DDPO (Diversified Direct Preference Optimization) e DORPO, entrambe pensate per incentivare varietà e qualità nelle risposte testuali dei LLM. Il problema affrontato è l’omogeneità delle generazioni post-addestramento: output spesso ripetitivi, poco ispirati. Le due tecniche operano premiando le risposte rare ma valide, aumentando così la ricchezza narrativa. Test su dataset creativi – come i prompt di scrittura di Reddit – mostrano che i modelli addestrati con DDPO superano persino GPT-4o per varietà mantenendo coerenza e qualità. Le applicazioni potenziali sono ampie: dalla generazione di contenuti editoriali alla narrazione automatica nei videogame, fino alla personalizzazione nei chatbot conversazionali. L’obiettivo è far emergere l’unicità, rendendo l’AI uno strumento meno algoritmico e più ispirato. Midjourney dimostra così che anche i modelli testuali possono evolversi per servire ambiti fortemente soggettivi e creativi. Un contributo importante per chi desidera modelli generativi più espressivi, capaci di riflettere lo stile e l’intento umano senza sacrificare la precisione. Per approfondire clicca qui