Novità e trend

VALL-E di Microsoft imita qualsiasi voce: bastano tre secondi di registrazione

Martin Jud
11.1.2023
Traduzione: tradotto automaticamente

DALL-E è seguito da VALL-E: Microsoft e OpenAI hanno creato una nuova intelligenza artificiale (AI) in grado di imitare le voci. Una registrazione vocale di soli tre secondi dovrebbe essere un input sufficiente per l'IA.

Oggi lo sappiamo: Ciò che le foto o i video mostrano non deve necessariamente essere accaduto. Dopo ChatGPT e DALL-E, è anche chiaro che un testo non deve necessariamente provenire dalla penna di un autore o un'immagine dal pennello di un artista. Ora è il turno della voce.

Microsoft è consapevole che l'intelligenza artificiale è in grado di imitare ciò che sente in modo naturale e con colori emotivi.

Microsoft è consapevole del fatto che la tecnologia ha anche un potenziale di uso improprio. Per questo motivo, un protocollo nelle applicazioni future garantirà che i contenuti creati da VALL-E possano essere riconosciuti come tali.

L'AI fornisce risultati impressionanti con gli esempi presentati da Microsoft. Per l'addestramento sono state elaborate 60.000 ore di registrazioni in lingua inglese. Ciò corrisponde a cento volte l'input delle sintesi vocali esistenti.

Immagine di copertina: shutterstock

A 52 persone piace questo articolo


User Avatar
User Avatar

La mia musa ispiratrice si trova ovunque. Quando non la trovo, mi lascio ispirare dai miei sogni. La vita può essere vissuta anche sognando a occhi aperti.


Informatica
Segui gli argomenti e ricevi gli aggiornamenti settimanali relativi ai tuoi interessi.

Software
Segui gli argomenti e ricevi gli aggiornamenti settimanali relativi ai tuoi interessi.

Audio
Segui gli argomenti e ricevi gli aggiornamenti settimanali relativi ai tuoi interessi.

Novità e trend

Dal nuovo iPhone al revival della moda anni '80. La redazione fa chiarezza.

Visualizza tutti