BİLİM VE TEKNOLOJİ

70.000 saatlik Minecraft videosu izleyen bir bot, AI’nın bir sonraki büyük şeyinin kilidini açabilir


Sonuç, yapay öğrenme olarak bilinen, sinir ağlarının görevleri insanların yaptıklarını izleyerek nasıl yapacakları konusunda eğitildiği bir teknik için bir atılımdır. Taklit öğrenme, robot kollarını kontrol etmek, araba sürmek veya web sayfalarında gezinmek için yapay zekayı eğitmek için kullanılabilir.

İnsanların farklı görevleri yerine getirdiğini gösteren çok sayıda çevrimiçi video var. Araştırmacılar, bu kaynaktan yararlanarak, GPT-3’ün büyük dil modelleri için yaptıklarını taklit öğrenme için yapmayı umuyorlar. Yeni Minecraft’ın arkasındaki ekipten biri olan OpenAI’den Bowen Baker, “Son birkaç yılda, internetin muazzam alanlarında eğitilmiş büyük modellerden inanılmaz yetenekler geldiğini gördüğümüz bu GPT-3 paradigmasının yükselişini gördük” diyor. bot. “Bunun büyük bir kısmı, insanların çevrimiçi olduklarında ne yaptıklarını modelliyor olmamızdan kaynaklanıyor.”

Taklit öğrenimine yönelik mevcut yaklaşımlardaki sorun, video gösterilerinin her adımda etiketlenmesi gerekmesidir: bu eylemi yapmak bunu gerçekleştirir, bu eylemi yapmak bunu sağlar vb. Bu şekilde elle açıklama eklemek çok iş gerektirir ve bu nedenle bu tür veri kümeleri küçük olma eğilimindedir. Baker ve meslektaşları, çevrimiçi olarak kullanılabilen milyonlarca videoyu yeni bir veri kümesine dönüştürmenin bir yolunu bulmak istedi.

Video Ön Eğitimi (VPT) olarak adlandırılan ekibin yaklaşımı, videoları otomatik olarak etiketlemek için başka bir sinir ağını eğiterek taklit öğrenimindeki darboğazın üstesinden gelir. İlk olarak Minecraft oynamaları için kitle çalışanlarını işe aldılar ve klavye ve fare tıklamalarını ekranlarından videonun yanında kaydettiler. Bu, araştırmacılara eylemleri ekrandaki sonuçla eşleştirmek için bir model eğitmek için kullandıkları 2000 saatlik açıklamalı Minecraft oyunu verdi. Belirli bir durumda bir fare düğmesine tıklamak, örneğin karakterin baltasını sallamasını sağlar.

Bir sonraki adım, internetten alınan 70.000 saatlik etiketsiz video için eylem etiketleri oluşturmak üzere bu modeli kullanmak ve ardından Minecraft botunu bu daha büyük veri kümesi üzerinde eğitmekti.

Daha önce taklit öğrenimi üzerinde çalışmış olan Sony AI America’nın yönetici direktörü Peter Stone, “Video, büyük potansiyele sahip bir eğitim kaynağıdır” diyor.



Source link