Yapay zeka, kuş göçünü inceleme şeklimizi değiştiriyor
1800'lerin sonlarında bilim insanları, göçmen kuşların türe özgü gece uçuş çağrıları (akustik parmak izleri) yaptığını fark etti. 1950'lerde mikrofonlar ticari olarak satışa sunulduğunda, bilim adamları geceleri kuşları kaydetmeye başladı. Farnsworth, 1990'larda bu akustik ekoloji araştırmalarının bir kısmına öncülük etti. Ancak o zaman bile, bazıları insanların duyabileceği frekans aralığının sınırında olan kısa çağrıları tespit etmek zordu. Bilim insanları, sesi görselleştiren spektrogramlara bakarken gerçek zamanlı olarak araştırmaları gereken binlerce kasetle karşılaştılar. Farnsworth, dijital teknolojinin kaydı kolaylaştırmasına rağmen “daimi sorun”un, “muazzam miktarda ses verisi toplamanın giderek daha kolay hale gelmesi, ancak bunların bir kısmını analiz etmenin bile giderek zorlaşması” olduğunu söylüyor.
Daha sonra Farnsworth, NYU'nun Müzik ve Ses Araştırma Laboratuvarı müdürü Juan Pablo Bello ile tanıştı. New York City'deki kentsel gürültü kirliliğinin kaynaklarını belirlemek için makine öğrenimini kullanan bir projeden yeni çıkan Bello, gece uçuş çağrıları sorununu üstlenmeyi kabul etti. Fransız makine dinleme uzmanı Vincent Lostanlen'in de dahil olduğu bir ekip kurdu ve 2015 yılında süreci otomatikleştirmek için BirdVox projesi doğdu. Farnsworth, “Herkes, 'Eninde sonunda bu ceviz kırıldığında bu çok zengin bir bilgi kaynağı olacak' diyordu” diyor. Ancak Lostanlen, başlangıçta “bunun mümkün olduğuna dair en ufak bir ipucu bile yoktu” diye anımsıyor. Makine öğreniminin Farnsworth gibi uzmanların dinleme becerilerine yaklaşması hayal bile edilemez görünüyordu.
Bello “Andrew bizim kahramanımız” diyor. “Bilgisayarlarda taklit etmek istediğimiz tek şey Andrew.”
Yağmur suyunun mikrofonlara verdiği zarardan kaynaklanan düşük vızıltı gibi hataları görmezden gelmek için bir sinir ağı olan BirdVoxDetect'i eğiterek işe başladılar. Daha sonra sistemi, türler arasında (ve hatta kendi içinde) farklılık gösteren ve bir araba alarmının cıvıltısı veya bahar dikizcisinin sesiyle kolayca karıştırılabilecek uçuş çağrılarını tespit edecek şekilde eğittiler. Lostanlen, bu zorluğun, akıllı bir konuşmacının benzersiz “uyandırma sözcüğünü” dinlerken karşılaştığı zorluğa benzer olduğunu söylüyor, ancak bu durumda hedef gürültüden mikrofona olan mesafe çok daha fazla (bu da telafi etmek için çok daha fazla arka plan gürültüsü anlamına geliyor) için). Ve elbette bilim insanları tetikleyici olarak “Alexa” veya “Hey Google” gibi benzersiz bir ses seçemediler. “Kuşlar için aslında bu seçimi yapmıyoruz. Charles Darwin bu seçimi bizim için yaptı” diye şaka yapıyor. Şans eseri, üzerinde çalışacak çok fazla eğitim verisi vardı; Farnsworth'un ekibi, Ithaca'daki mikrofonlar tarafından toplanan binlerce saatlik kayda elle açıklamalar eklemişti.
BirdVoxDetect'in uçuş çağrılarını algılamak üzere eğitilmesiyle, önümüzde başka bir zor görev daha vardı: Çok az sayıda uzman kuş gözlemcisinin kulak yoluyla yapabileceği, algılanan çağrıları türlere göre sınıflandırmayı öğretmek. Belirsizliğin üstesinden gelmek için ve her tür için eğitim verisi bulunmadığından hiyerarşik bir sisteme karar verdiler. Örneğin, belirli bir çağrı için BirdVoxDetect, türden emin olmasa bile kuşun sırasını ve ailesini tanımlayabilir; tıpkı bir kuş gözlemcisinin en azından bir çağrıyı sarı sağrılı veya ötleğen ötleğeni olarak tanımlayabilmesi gibi. kestane taraflı. Eğitimde sinir ağı, taksonomik ağaca daha yakın olan kuşları karıştırdığında daha az cezalandırıldı.