Telefon : +90 212 275 71 06  
Google robotlara birbirlerinden nasıl öğreneceklerini öğretiyor

Google robotlara birbirlerinden nasıl öğreneceklerini öğretiyor

Dünya robotları birleşiyor ve bakış açınıza göre bu ya harika ya da korkutucu bir şey.


Google'ın robotik öğrenmeyi hızlandırmak için bir planı var ve bu plan robotların – bulut aracılığıyla – deneyimleri paylaşmasını ve – derin öğrenme aracılığıyla – yeteneklerini kolektif şekilde geliştirmesini de kapsıyor.


 Google Brain ekibinden, Sergey Levine, Alphabet iştirakleri DeepMind ve GoogleX'ten iş arkadaşlarıyla birlikte bir blog yayınladı ve “birden fazla robot arasında genel amaçlı beceri öğrenimi” için bir yaklaşımı açıkladı.


Evler ve ofisler gibi gerçek dünya koşullarında robotlara en basit görevleri bile nasıl yapacaklarını öğretmek yıllardır robot bilimciler arasında tartışma konusu olmuştur. Bu zorluğun üstesinden gelmek için Google araştırmacıları iki yeni teknolojik gelişimi bir araya getirmeye karar verdi. Birincisi bulut robotikleri; bu kavram robotların bir çevrimiçi depo üzerinden veriyi ve becerileri paylaştığını ön görüyor. Diğeri ise makine öğrenimi ve özellikle robotların birbirinden öğrenmesini sağlayan derin sinir ağları uygulaması.


Araştırmacılar tarafından gerçekleştirilen bir dizi deneyde ayrı robotik kollar, verilen bir görevi art arda yapmaya çalıştı. Şaşırtıcı olmayan bir biçimde her robot, ortamdaki ve kendi hareketlerindeki küçük değişimlere adapte olmayı öğrenerek kendi becerisini zaman içinde geliştirebildi. Ancak Google ekibi bu noktada durmadı. Kendi ifadeleriyle “genel bir beceri modeli oluşturmak için” robotların deneyimlerini bir havuz da toplamasını sağladılar ve bu yaklaşım kendi başlarına edinim süreçlerine göre daha iyi ve hızlı sonuçlar verdi.


“Robotlar tarafından öğrenilen yetenekler hala görece çok basit düzeyde, örneğin nesneleri itiyor, kapıları açıyorlar, ancak bu gibi becerileri kolektif öğrenme yoluyla daha hızlı ve verimli öğrenmeleri sayesinde, gelecekte robotlar daha zengin davranışsal karakterleri, nihayetinde günlük yaşamlarımızda bize yardım etmelerini sağlayacak düzeyde edinebilirler”.


Bu yılın başlarında Levine ve GoogleX çalışanları derin sinirsel ağların robotların bir kavrama görevini birbirilerinden öğrenmelerine nasıl yardımcı olabileceğini gösterdi. Bu çalışmada bir grup robot kolu yaklaşık 800.000 kavrama denemesi yaptı ve başlangıçta çoğunda başarısız olmalarına rağmen, sinir ağı kendini sürekli yeniden eğittikçe başarı oranı belirgin bir şekilde arttı.


Son denemelerinde Google araştırmacıları üç farklı senaryoyu test etti. Birincisinde robotlar motor becerilerini doğrudan deneme yanılma pratiği ile öğrendi. Her robot bir kapıyı tekrar ve tekrar açmaya çalıştığı sürece bir sinirsel ağ kopyası ile başladı. Robotlar, performanslarından edindikleri deneyimi düzenli aralıklarla merkezi bir sunucuya gönderdi, bu sunucu veriyi, eylem ve başarının birbiriyle olan ilişkisini daha iyi algılayan yeni bir sinirsel ağ oluşturmak için kullandı. Sunucu daha sonra güncellenen sinirsel ağı yeniden robotlara gönderdi.


Araştırmacıların açıklaması şu yöndeydi: “Bu güncellenen ağın dünyadaki eylemin gerçek değerini tahmin etmede biraz daha iyi olduğu düşünülürse, robotlar daha iyi davranış üretecektir”.


“Bu döngü görevi iyileştirmeye devam etmek için tekrarlanabilir.”


İkinci senaryoda, araştırmacılar robotların nesnelerle yalnızca deneme yanılma yoluyla değil ayrıca nesnelerin, ortamın ve kendi davranışlarının dahili modellerini oluşturarak da etkileşime girmelerini istedi. Kapı açma görevinde olduğu gibi, her robot kendi sinir ağı kopyası ile başladı ve çeşitli ev içi nesnelerle “oynadı”.


Robotlar daha sonra deneyimlerini birbirleri ile paylaştı ve birlikte araştırmacıların “tekil tahmini model” adını verdiği şeyi oluşturdu; bu model robotlara nesnelerle etkileşimde söz konusu olan fizik kuralarına ilişkin kesin bir algı kazandırıyor. Aynı tahmini modeli muhtemelen tek bir robotu kullanarak da oluşturabilirsiniz, ancak birden fazla robotun deneyimlerinin bir araya getirilmesi size çok daha fazla zaman kazandıracaktır.


Son olarak üçüncü senaryoda robotlar becerileri insanlardan yardım alarak öğrendi. Buradaki ana fikir, insanların nesneler ve dünya ile etkileşimlere dair çok daha fazla sezgiye sahip olması ve becerilerin manipülasyonu yoluyla robotlara yardım ederek bu sezginin bir kısmını robotlara aktarabileceğimiz ve onların becerileri daha hızlı öğrenmesini sağlayabileceğimiz şeklinde özetlenebilir. Deneyde bir araştırmacı bir grup robota farklı kapıları açma konusunda yardım ederken merkezi bir sunucuda bulunan bir sinir ağı onların deneyimlerini kodluyordu. Ardından robotlar, sinir ağının gelişmesine yardımcı olması açısından giderek daha da zorlaşan bir dizi deneme yanılma sürecinden geçti.


Araştırmacıların bildirdiğine göre “Deneme yanılma yöntemiyle öğrenme ve insan rehberliği birleştiğinde, robotlar kapı açma becerisini yalnızca birkaç saat içinde kolektif olarak öğrenebildi".


“Robotlar birbirinden farklı görünen kapılar konusunda eğitildiğinden, son ilke, daha önce hiçbir robotun görmediği bir kola sahip kapı üzerinden başarılı olacaktır.”


Google ekibi robotlarının öğrendiği becerilerin hala oldukça sınırlı düzeyde olduğunu belirtti. Ancak robotlar ve algoritmalar daha iyi hale geldikçe ve daha geniş kapsamda kullanılabildikçe, bunların deneyimlerinin toplanması fikrinin robotlara yararlı görevlerin yapılmasını öğretmede kritik olacağının görüleceğini umuyorlar:


Araştırmacıların sözleriyle; “Yukarıda açıklanan her üç deneyin tümünde, iletişim ve deneyim alışverişi kabiliyeti sayesinde robotlar çok daha hızlı ve verimli öğrenebiliyor. Bu sonuç, robotik öğrenmeyi derin öğrenme ile birleştirdiğimizde özellikle önemli hale geliyor, ki yukarıda açıklanan tüm deneylerde ortaya çıkan sonuç da bu yönde. Geniş kapsamlı eğitim verisi sunulduğunda en çok işe yarayanın derin öğrenme olduğunu daha önce görmüştük. Örneğin popüler ImageNet ölçütü 1,5 milyondan fazla etiketli örneği kullanıyor. Bu miktardaki verinin tek bir robot tarafından bir kaç yıl içinde edinilmesi mümkün değilken, aynı miktardaki deneyimin birkaç haftalık bir süreçte birden fazla robottan edinilmesi çok daha verimli sonuçlar sağlıyor. Daha çabuk öğrenmenin yanı sıra, bu yaklaşım çok daha çeşitli deneyimlerden faydalanabilir – bir gerçek dünya konuşlandırmasında farklı yerlerde ve farklı ayarlarda robotlar olabilir, heterojen, çeşitli deneyimleri paylaşarak, tekil ve ileri düzeyde genelleştirilebilir bir sunum oluşturabilirler.”


Robotlar öğrenme sanatında ustalaştıkça gelecekte bir gün yeni becerileri insanların hiçbir zaman yapamadığı kadar çabuk edinmeleri kaçınılmaz olacaktır.


Orijinal metin için tıklayınız.