VASA: Microsoft AI, fotoğraf ve ses kaydından “konuşan yüz” üretiyor

hadicanim

Aktif Üye
Bir Microsoft araştırma ekibi, fotoğraf ve ses kaydı çekebilen ve fotoğrafın konuşuyormuş gibi göründüğü inanılmaz derecede gerçekçi video klipler oluşturabilen bir yapay zeka aracı geliştirdi. Çerçeveye VASA adını verdiler, şimdi ilk versiyon olan VASA-1. Kısaltma, oluşturulan avatarların “görsel duygusal becerilerini” ifade eder. Araç yalnızca “dudaklar ve ses tonu arasında değerli senkronizasyon” yaratmakla kalmıyor, aynı zamanda çok çeşitli ifadeli yüz ifadelerini ve doğal kafa hareketlerini de simüle edebiliyor. VASA zaten herhangi bir uzunluktaki ses dosyalarını işleyebiliyor ve Nvidia RTX 4090'a sahip bir PC'de yüzlerin konuşan videolarını sorunsuz bir şekilde oluşturabiliyor.

Reklamcılık



Önerilen editoryal içerik



İzniniz halinde buraya harici bir video (Kaltura A.Ş.) yüklenecektir.



Videoları her zaman yükle

Videoyu şimdi yükle



Tamamen senkronize konuşan üç kadın yüzü



(Kaynak: Microsoft Asya)




Microsoft Asya çalışanları, bir proje sayfasında aracın performansını gösteren bir dizi örneği bir araya getirdi. Farklı metinleri anlamlı bir şekilde okuyan farklı yüzlerin yer aldığı çok sayıda kare video görebilirsiniz. Ekip, tüm portrelerin sanal, var olmayan yapay zeka tarafından oluşturulmuş temsiller olduğunu garanti ediyor; bunun tek istisnası, Leonardo da Vinci'nin Mona Lisa'sının animasyonu. Bazı videolarda, oluşturulan yüzün metni farklı duygularla nasıl okuduğuna dair karşılaştırmalar var. Başka bir örnek, bir metni tamamen senkronize bir şekilde konuşan üç kadının yüzünü gösteriyor.


Önerilen editoryal içerik



İzniniz halinde buraya harici bir video (Kaltura A.Ş.) yüklenecektir.



Videoları her zaman yükle

Videoyu şimdi yükle



Mona Lisa biraz farklı



(Kaynak: Microsoft Asya)




Aracın piyasaya sürülmesi planlanmadı


Ekip, araştırma projesinin amacının, fotogerçekçi avatarları gerçek zamanlı olarak canlandıracak bir teknik geliştirmek olduğunu yazıyor. Ancak bu, teknolojinin gerçek insanları taklit etmek için kötüye kullanılabileceğini kabul ediyor. Grup, potansiyel faydaların araştırmayı haklı çıkaracağına inanıyor. Bahsedilen nedenlerden ötürü, şu anda çevrimiçi bir demo yayınlama, geliştirme erişimi sağlama ve hatta buna dayalı bir ürün yayınlama planımız yok. Bu sorun ancak teknolojinin yalnızca sorumlu bir şekilde kullanıldığından emin olduğumuzda ele alınacaktır. Şimdi sadece araştırmayı sunmak istiyorlardı.


Önerilen editoryal içerik



İzniniz halinde buraya harici bir video (Kaltura A.Ş.) yüklenecektir.



Videoları her zaman yükle

Videoyu şimdi yükle



VASA-1'in gerçek zamanlı gösterimi



(Kaynak: Microsoft Asya)





(mho)



Haberin Sonu