Sahte fotoğrafa karşı akıllı bir kalkan
PhotoGuard adı verilen araç, fotoğrafları insan gözüyle görülemeyecek kadar küçük şekillerde değiştirerek ancak manipüle edilmelerini önleyerek koruyucu bir kalkan gibi çalışıyor. Birisi, PhotoGuard tarafından “bağışıklanmış” bir görüntüyü işlemek için Stable Diffusion gibi üretken bir AI modelini temel alan bir düzenleme uygulamasını kullanmaya çalışırsa, sonuç gerçekçi olmayacak veya çarpık görünecektir.
Araştırmaya katkıda bulunan MIT doktora öğrencisi Hadi Salman, şu anda “herkes görüntümüzü alabilir, istediği gibi değiştirebilir, bizi çok kötü durumlara sokabilir ve bize şantaj yapabilir” diyor. Salman, PhotoGuard’ın “görüntülerimizin bu modeller tarafından kötü niyetli olarak manipüle edilmesi sorununu çözmeye yönelik bir girişim” olduğunu söylüyor. Araç, örneğin kadınların özçekimlerinin rıza dışı deepfake pornografiye dönüştürülmesini önlemeye yardımcı olabilir.
MIT ekibi, görüntülerin Kararlı Yayılım kullanılarak düzenlenmesini durdurmak için iki farklı teknik kullandı. İlkinde PhotoGuard, görüntüye algılanamayan sinyaller ekleyerek yapay zeka modelinin görüntüyü saf gri bir blok gibi başka bir şey olarak yorumlamasını sağlıyor. İkincisinde, yapay zeka modellerinin, esasen onları model tarafından işlenme şeklini değiştiren gizli sinyallerle kodlayarak, görüntü oluşturma şeklini bozuyor, böylece düzenlenen herhangi bir görüntü o gri bloğa benziyor. Teknik şimdilik yalnızca açık kaynaklı bir görüntü oluşturma modeli olan Stable Diffusion’da güvenilir bir şekilde çalışıyor.
Araştırmaya katkıda bulunan elektrik mühendisliği ve bilgisayar bilimleri profesörü Aleksander Madry, SM ’09, PhD ’11, teorik olarak insanların bu koruyucu kalkanı görüntülerine çevrimiçi yüklemeden önce uygulayabileceğini söylüyor. Ancak teknoloji şirketlerinin bunu insanların platformlarına otomatik olarak yüklediği görüntülere eklemesi daha etkili bir yaklaşım olabilir; ancak bu bir silahlanma yarışıdır çünkü her türlü yeni korumayı geçersiz kılabilecek yeni yapay zeka modelleri her zaman ortaya çıkıyor. .