Bir OpenAI yan ürünü, robotların insanlar gibi görevleri öğrenmesine yardımcı olan bir yapay zeka modeli oluşturdu
RFM-1 adı verilen yeni model, Covariant'ın Crate & Barrel ve Bonprix gibi müşterilerin dünya çapındaki depolarda kullandığı küçük ürün toplama robotları filosundan ve ayrıca internetten alınan kelimeler ve videolardan toplanan yıllar süren verilerle eğitildi. Model önümüzdeki aylarda Covariant müşterilerinin beğenisine sunulacak. Şirket, sistemin gerçek dünyada konuşlandırıldığında daha yetenekli ve verimli olmasını umuyor.
Peki ne yapabilir? Geçen hafta katıldığım bir gösteride Covariant kurucu ortakları Peter Chen ve Pieter Abbeel bana kullanıcıların beş farklı girdi türünü kullanarak modeli nasıl yönlendirebileceklerini gösterdiler: metin, görseller, video, robot talimatları ve ölçümler.
Örneğin, ona spor malzemeleriyle dolu bir çöp kutusunun resmini gösterin ve tenis topu paketini almasını söyleyin. Robot daha sonra öğeyi alabilir, tenis topları gittikten sonra çöp kutusunun nasıl görüneceğine dair bir görüntü oluşturabilir veya robotun görevi yerine getirirken nasıl görüneceğine dair kuşbakışı bir video oluşturabilir.
Model, öğeyi düzgün bir şekilde yakalayamayacağını öngörürse, hatta şunu yazabilir: “İyi bir kavrayamıyorum. Herhangi bir ipucun var mı?” Bir yanıt, daha iyi kavrama sağlamak için kollarında belirli sayıda vantuz kullanmasını tavsiye edebilir (örneğin altıya karşı sekiz).
Chen bana bunun, önceki nesil endüstriyel robotlara güç veren karmaşık, göreve özel kod yerine eğitim verilerini kullanarak çevrelerine uyum sağlayabilen robotlarda ileriye doğru bir sıçramayı temsil ettiğini söyledi. Bu aynı zamanda yöneticilerin, insan emeğinin sınırlamaları endişesi olmadan, insan dilinde talimat verebileceği çalışma sahalarına doğru atılmış bir adımdır. (“Aşağıdaki tarifi kullanarak kırmızı biberli makarna için 600 yemek hazırlama seti paketleyin. Ara vermeyin!”)
New York Üniversitesi'nde genel amaçlı robot bilimi ve yapay zeka laboratuvarını yöneten ve Covariant'la hiçbir bağı bulunmayan araştırmacı Lerrel Pinto, robot uzmanlarının daha önce temel çok modlu robotlar oluşturup bunları laboratuvar ortamlarında kullanmış olmasına rağmen, bunu yapabilecek ölçekte bir tane dağıttıklarını söylüyor. Bu kadar çok modda iletişim kurmak şirket için etkileyici bir başarıya işaret ediyor.
Pinto bana, rakiplerini geride bırakmak için Covariant'ın robotun vahşi doğada kullanışlı olabilmesi için yeterli veriye sahip olması gerektiğini söyledi. Depo zeminleri ve yükleme iskeleleri, sürekli olarak yeni talimatlarla, insanlarla, nesnelerle ve ortamlarla etkileşimde bulunarak teste tabi tutulacağı yerlerdir.
“İyi modelleri eğitecek gruplar, ya halihazırda büyük miktarda robot verisine erişimi olan ya da bu verileri üretme becerisine sahip olanlar olacak” diyor.