I-JEPA: Sağduyu ile yapay zekaya doğru ilk adım mı?

hadicanim

Aktif Üye


  1. I-JEPA: Sağduyu ile yapay zekaya doğru ilk adım mı?

ChatGPT, Midjourney & Co. gibi AI sistemlerinin başarıları ve ilerlemeleri birçokları için büyüleyici olsa da: Bu üretken sistemler dünya hakkında gerçekten hiçbir şey anlamadı. Ne de olsa tasvir ettikleri veya hakkında sohbet ettikleri nesnelerin içsel modellerine sahip değiller ve bunların özellikleri ve birbirleriyle olan ilişkileri hakkında hiçbir fikirleri yok. (Herhangi bir şüpheniz varsa, ChatGPT’ye kendinize sorun – model, klavyenin bu tarafındaki dünya hakkında hiçbir fikirleri olmadığını onaylayacaktır).


Şu anda, bu herhangi bir AI meraklısını rahatsız etmiyor gibi görünüyor. Bununla birlikte, ABD şirketi Meta’dan baş yapay zeka bilimcisi Yann LeCun, tam olarak bunu, aptalca uzman sistemlerin ötesinde, genel bir yapay zekaya giden yolda aşılması gereken bir sınır olarak görüyor. LeCun, bir yıl önce Technology Review’a vizyonunu ana hatlarıyla açıkladı, ancak muhtemelen araştırma topluluğu dışında bir heyecan yaratmadı çünkü yapay zeka ancak altı ay sonra gişe rekorları kıran bir haber oldu.

LeCun’un vizyonuna göre, mevcut yapay zeka sistemlerinin sınırlamalarının üstesinden gelmek, çıkarımlar yapmak için yalnızca dünyanın nasıl çalıştığına dair dahili modellere sahip olmayan makineler gerektiriyor. Daha ziyade, bu modelleri bağımsız olarak – otonom ve tamamen beslendikleri girdi temelinde – geliştirebilmeli ve uyarlayabilmelidirler.

Soyut kavramları tanır


Meta AI şimdi, baş araştırmacısı LeCun’un vizyonunun bir bölümünü gerçekleştirmeyi amaçlayan ilk AI modelini geliştirdi. Image Joint Embedding Predictive Architecture (I-JEPA) adı verilen mimari, görüntülerdeki nesneleri tanır ve geliştiricilerine göre, pikselleri analiz etmek yerine dünyanın dahili bir modeli sayesinde görüntülerin içeriğini soyut düzeyde karşılaştırması gerekir. Modelle ilgili ücretsiz bir makale, önümüzdeki Pazar günü Vancouver’da başlayacak olan IEEE/CVF Computer Vision and Pattern Recognition 2023 Konferansı’nda (CVPR) sunulacak ve LeCun’un araştırmacıları eğitim kodunu Github’da yayınladı.

Meta’ya göre, LeCun’un yaklaşımı I-JEPA’da şimdiden meyvelerini veriyor: Sistem, çeşitli bilgisayarla görme görevlerinde daha iyi performans göstermeli (yani daha az hata yapmalı) ve geleneksel modellere göre önemli ölçüde daha az eğitim gerektirmelidir.

Gözlem yoluyla arka plan bilgisi



Bununla birlikte, görsellerin somut bilgisinin ötesinde, Meta AI duyurusundaki bir formülasyon özellikle ilginçtir: “Üzerindeki çalışmalarımız […] Birleşik Gömülü Tahmine Dayalı Mimari (JEPA) modelleri […] İnsanların sadece pasif gözlem yoluyla dünya hakkında muazzam miktarda arka plan bilgisi öğrenebilecekleri gerçeğine dayanıyor.” Bu, herkesin oturup istatistiksel tekniklerin zaferinden önce (Stanley’nin 2005’teki zaferinden bu yana ortalıkta olan) dikkatini çekmesini sağlamalıdır. DARPA Grand Challenge öngörülebilirdi) yapay zeka üzerine araştırma yapıyordu.


Çünkü genel olarak uygulanabilir bir yapay zeka oluşturmaya yönelik pek çok yaklaşımın tökezlemesine neden olan şey, tam da bu genel arka plan bilgisiydi. Öne çıkan bir örnek Cyc’dir: Doug Lenat ve ekibi, yapay zeka sistemlerinin sonuçlarını bu temelde çıkarabilmesi için dünya bilgisini kapsamlı bir ontolojide modellemek istedi. Bunu yaparken, insanlar tarafından insanlar için yazılan metinlerin bilgisayarlarda tamamen yeni olan pek çok bilgiyi dışarıda bıraktığını zor yoldan öğrendiler: Örneğin, bir kişinin genellikle sol ayağıyla aynı şehirde olması, sırasında parlak olması. gün, eğer kışın kutup çemberinin kuzeyinde değilseniz, sahnede duran ve şarkı söyleyen biri: Yağmurda duruyorum ıslanmıyor … insanlar bunu sezgisel olarak anlıyor çünkü bu geçmişe sahipler bilgi, tıpkı onlar gibi dünya işleri, hayatlarının ilk günlerinden beri bir yandan öğreniyor.

Hala uzun bir yol


Açık olan bir şey var: JEPA modelleri, makinelerdeki sağduyu eksikliği temel sorununu hemen çözmeyecek – ve bununla ne kadar ileri gidecekleri de açık. Ancak meta-araştırmacılar, yaklaşımlarının geleneksel üretken modellerin birkaç zayıflığını ortadan kaldıracağını umuyorlar. Ona göre, modeller “kapsamlı, öngörülebilir kavramları yakalamak yerine alakasız ayrıntılara çok fazla odaklandıkları” için bir insanın asla yapmayacağı hatalar yapma eğilimindeydiler.

En iyi örnek: Elleri tasvir ederken, AI görüntü oluşturucuları genellikle çok fazla veya çok az parmak oluşturur. Burada yazılımın elin ne olduğu hakkında hiçbir fikri olmadığı, genellikle bir başparmak ve dört parmağı olduğu, bir sol ve bir sağ el olduğu ve hangi duruşların doğal olduğu açıkça görülüyor. Bir JEPA modelinin, bir elin ne olduğunu yalnızca resimlerden, videolardan veya başka herhangi bir şeyden “gözlemleyerek” öğrenip öğrenmediği ve ondan, özellikler ve izleme olmadan dahili bir el konsepti geliştirip geliştirmediği, ileride görülecektir. Çünkü soyutlama, görünüşe göre yapay zeka yaratmanın en iyi yoluydu – nöral ağlar, bilgi işlem gücünden yoksun oldukları için hala bir çıkmaz sokak olarak kabul edilirken.


(pek)



Haberin Sonu