Çin’in üretken yapay zekanın güvenliğini değerlendirme planı
Geçen hafta tüm bunların pratikte nasıl görünebileceği konusunda netlik kazandık.
11 Ekim’de, Ulusal Bilgi Güvenliği Standardizasyon Teknik Komitesi adlı bir Çin hükümet kuruluşu, üretken bir yapay zeka modelinin sorunlu olup olmadığının nasıl belirleneceğine ilişkin ayrıntılı kurallar öneren bir taslak belge yayınladı. Genellikle TC260 olarak kısaltılan komite, siber güvenlikten gizliliğe ve BT altyapısına kadar çeşitli konularda teknoloji endüstrisi kurallarını belirlemek için kurumsal temsilcilere, akademisyenlere ve düzenleyicilere danışır.
Yapay zekanın nasıl düzenleneceğine dair görmüş olabileceğiniz birçok manifestonun aksine, bu standartlar belgesi çok ayrıntılı: bir veri kaynağının üretken yapay zeka eğitiminin ne zaman yasaklanması gerektiğine ilişkin net kriterleri belirler ve bir modeli test etmek için hazırlanması gereken anahtar kelimelerin ve örnek soruların tam sayısına ilişkin ölçümler verir.
Belgeyi benim adıma işaretleyen Carnegie Uluslararası Barış Vakfı’nın küresel teknoloji uzmanı Matt Sheehan, belgeyi ilk okuduğunda “bunun üretken yapay zeka düzenlemesiyle ilgili en temelli ve spesifik belge olduğunu hissettiğini” söyledi. Ekledi, “Bu aslında şirketlere pek çok belirsiz gereksinime sahip üretken yapay zeka düzenlemelerine nasıl uyum sağlayacaklarına dair bir değerlendirme listesi veya taktik kitabı sağlıyor.”
Aynı zamanda şirketlerin yapay zeka modellerinde neleri “güvenlik riski” olarak değerlendirmesi gerektiğini de açıklığa kavuşturuyor; Pekin hem algoritmik önyargılar gibi evrensel endişelerden hem de yalnızca Çin bağlamında hassas olan içerikten kurtulmaya çalışıyor. “Bu, zaten çok karmaşık olan sansür altyapısına bir uyarlama” diyor.
Peki bu özel kurallar neye benziyor?
Eğitimde: Tüm yapay zeka temel modelleri şu anda birçok derlem (metin ve resim veritabanları) üzerinde eğitilmektedir; bunların bazılarında önyargılar ve denetlenmemiş içerik bulunmaktadır. TC260 standartları, şirketlerin yalnızca derlemleri çeşitlendirmesini (dilleri ve formatları karıştırarak) değil, aynı zamanda tüm eğitim materyallerinin kalitesini de değerlendirmesini gerektirir.
Nasıl? Şirketler tek bir kaynaktan rastgele 4.000 “veri parçası” örneklemelidir. Verilerin %5’inden fazlası “yasa dışı ve olumsuz bilgi” olarak değerlendiriliyorsa, bu derlem gelecekteki eğitimler için kara listeye alınmalıdır.