Monna Lisa rappa? La nuova intelligenza artificiale di Microsoft anima i volti dalle foto

Nan Ryu/Visual China Group/Getty Images

Microsoft è stata identificata il 19 marzo 2023 presso la sede dell'azienda a Seattle, Washington.


New York
CNN

Grazie alla nuova tecnologia di intelligenza artificiale di Microsoft, la Monna Lisa ora può fare molto più che semplicemente sorridere.

La settimana scorsa, i ricercatori Microsoft hanno descritto un nuovo modello di intelligenza artificiale che hanno sviluppato in grado di acquisire un'immagine fissa del volto di qualcuno e una clip audio di qualcuno che parla e creare automaticamente un video realistico di quella persona. È possibile creare video da volti animati, cartoni animati o opere d'arte, completi di avvincente sincronizzazione labiale e movimenti naturali del viso e della testa.

In un video dimostrativo, i ricercatori hanno mostrato come hanno animato la Gioconda per cantare un rap comico dell'attrice Anne Hathaway.

Vengono chiamati gli output del modello AI VASA-1, divertenti e leggermente inquietanti nella loro autenticità. Microsoft ha affermato che la tecnologia potrebbe essere utilizzata per l’istruzione o per “migliorare l’accessibilità per le persone con difficoltà di comunicazione” o per creare compagni virtuali per gli esseri umani. Ma è facile vedere come questo strumento possa essere abusato e utilizzato per impersonare persone reali.

Questa è una preoccupazione che va oltre Microsoft: stanno emergendo sempre più strumenti per creare immagini, video e audio generati dall'intelligenza artificiale. Gli esperti sono preoccupati Il loro uso improprio può portare a nuove forme di disinformazione. Alcuni temono anche che la tecnologia possa ulteriormente sconvolgere le industrie creative, dal cinema alla pubblicità.

Per ora, Microsoft afferma di non avere piani immediati per rilasciare al pubblico il modello VASA-1. La mossa è simile al modo in cui il partner Microsoft OpenAI gestisce le preoccupazioni Il suo strumento video generato dall'intelligenza artificialeSora: OpenAI ha preso in giro Sora a febbraio, ma finora lo ha reso disponibile solo a scopo di test per alcuni utenti professionali e professori di sicurezza informatica.

READ  Tre accusati nel 2018 dell'omicidio del rapper XXXTentacion

“Ci opponiamo a qualsiasi comportamento che crei contenuti falsi o dannosi da parte di persone reali”, hanno affermato i ricercatori di Microsoft in un post sul blog. Ma hanno aggiunto che “non hanno piani” per rilasciare pubblicamente i prodotti finché “non saremo sicuri che la tecnologia sarà utilizzata in modo responsabile e in conformità con le normative adeguate”.

Il nuovo modello di intelligenza artificiale di Microsoft è stato addestrato su diversi video di volti di persone mentre parlano ed è progettato per “riconoscere i movimenti naturali del viso e della testa come il movimento delle labbra, l'espressione (non labiale), lo sguardo fisso e il battito delle palpebre”, hanno detto i ricercatori. Quando VASA-1 anima una foto, il risultato è un video più realistico.

Ad esempio, in un video dimostrativo, il volto parlante ha la fronte e le labbra corrugate, in una clip di qualcuno che emette un suono agitato mentre gioca ai videogiochi.

Lo strumento AI può essere indirizzato per creare un video in cui il soggetto guarda in una certa direzione o esprime una certa emozione.

Ad un esame più attento, ci sono ancora segni che i video siano generati automaticamente, come sbattere le palpebre occasionali e movimenti esagerati delle sopracciglia. Ma Microsoft ritiene che il suo modello “superi in modo significativo” altri strumenti simili e “apri la strada al coinvolgimento in tempo reale con avatar realistici che imitano i comportamenti conversazionali umani”.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *