Sohbet botları için bir filigran, bir yapay zeka tarafından yazılan metni tespit edebilir
Örneğin, OpenAI’nin ChatGPT adlı chatbot’u Kasım ayında kullanıma sunulduğundan beri öğrenciler, kendileri için denemeler yazmak için bu robotu kullanarak kopya çekmeye çoktan başladılar. Haber sitesi CNET, makaleler yazmak için ChatGPT’yi kullandı, yalnızca intihal suçlamaları arasında düzeltmeler yapmak zorunda kaldı. Filigranlama yaklaşımını bu tür sistemlere piyasaya sürülmeden önce yerleştirmek, bu tür sorunların çözülmesine yardımcı olabilir.
Çalışmalarda, bu filigranlar, yapay zeka tarafından oluşturulan metni neredeyse kesin olarak tanımlamak için zaten kullanılmıştır. Örneğin Maryland Üniversitesi’ndeki araştırmacılar, oluşturdukları bir algılama algoritmasını kullanarak Meta’nın açık kaynaklı dil modeli OPT-6.7B tarafından oluşturulan metni tespit edebildiler. Çalışma, henüz hakem değerlendirmesinden geçmemiş bir makalede açıklanıyor ve kod, 15 Şubat civarında ücretsiz olarak sunulacak.
AI dil modelleri, her seferinde bir kelimeyi tahmin ederek ve üreterek çalışır. Her kelimeden sonra, damgalama algoritması, dil modelinin kelime dağarcığını bir “yeşil liste” ve “kırmızı liste”deki kelimelere rastgele böler ve ardından modelden yeşil listedeki kelimeleri seçmesini ister.
Bir pasajda ne kadar çok yeşil listeye alınmış kelime varsa, metnin bir makine tarafından oluşturulmuş olma olasılığı o kadar yüksektir. Bir kişi tarafından yazılan metin, daha rastgele bir kelime karışımı içerme eğilimindedir. Örneğin, “güzel” kelimesi için damgalama algoritması “çiçek” kelimesini yeşil ve “orkide” kelimesini kırmızı olarak sınıflandırabilir. Araştırmaya dahil olan Maryland Üniversitesi’nde yardımcı doçent olan Tom Goldstein, filigran algoritmasına sahip yapay zeka modelinin “orkide” yerine “çiçek” kelimesini kullanma olasılığının daha yüksek olduğunu açıklıyor.