OpenAI, metin komutlarını fotogerçekçi videolara dönüştürebilen yeni bir video-üretim modeli olan Sora‘yı tanıttı. Bu model, kullanıcıların yazdıkları metin talimatlarına dayanarak bir dakikaya kadar uzunlukta gerçekçi ve hayal gücü yüksek sahneler oluşturabiliyor. Sora, çoklu karakterler, belirli hareket türleri ve konu ile arka planın detaylı doğrulukları içeren karmaşık sahneler yaratabilme yeteneğine sahip.
Sora’nın Özellikleri
Sora, nesnelerin fiziksel dünyadaki varlığını anlayabilme, doğru aksesuarları yorumlayabilme ve canlı duygular ifade eden ikna edici karakterler üretebilme gibi yeteneklere sahip. Model ayrıca, bir fotoğraftan video üretebilme, mevcut bir videoda eksik kareleri doldurabilme veya onu genişletebilme kapasitesine de sahip. Ancak OpenAI, modelin karmaşık bir sahnenin fiziksel simülasyonunu doğru bir şekilde gerçekleştirmede zorlanabileceğini belirtiyor.

Videolar ve Rakipler
Tanıtılan demolar arasında, altın arayışı döneminde Kaliforniya’nın hava görünümü ve Tokyo treninin içinden çekilmiş gibi görünen bir video gibi etkileyici örnekler bulunuyor. OpenAI, bu alanda Google’ın Lumiere modeli gibi rakipleriyle rekabet ediyor. Lumiere de benzer şekilde kullanıcılara metinden video ve bir fotoğraftan video oluşturma imkanı tanıyor.
Erişim ve Gelecekteki Planlar
Şu an için Sora, potansiyel zararlar ve riskler değerlendirilirken “kırmızı ekip” üyeleri tarafından erişilebilir durumda. OpenAI, model üzerinde geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sağlıyor. Şirket ayrıca, DALL-E 3‘ün metin-ten-resim aracına kolayca çıkarılabilecek filigranlar eklediğini, ancak yapay zekâ ürünlerinin sahte, fotogerçekçi videoların gerçek sanılmasının olası sonuçlarıyla mücadele etmek zorunda olduğunu belirtiyor.
Open AI, her ne kadar telif haklarını korumak amaçlı ekipler kurduklarını iddia etse de daha önce New York Times’ın da bulunduğı telif davalarıyla güvenirliği sarsıldı.












Ne düşünüyorsun?