Quadcopter müfredat öğrenimiyle saniyeler içinde uçmayı öğreniyor

hadicanim

Aktif Üye
New York Üniversitesi Çevik Robotik ve Algı Laboratuvarı'ndaki bilim insanları, mini bir drone'a, değişen rüzgar koşullarında ve özel manevralar sırasında sabit havada durma da dahil olmak üzere uçmayı öğretmek için derin takviyeli öğrenmeyi (RL) kullanmayı başardılar. Tüm öğrenme süreci yalnızca 18 saniye sürer; bu, derleme sürecinden ve aygıt yazılımını drone'a yükleme işleminden daha kısadır.

Reklamcılık



Eğitim, M işlemcili bir Apple MacBook üzerindeki bir simülasyonda gerçekleştirilir. Araştırmacılar çok hızlı, çok rotorlu bir dinamik simülatörü çalıştırmak için bilgisayarın GPU'sunu kullanıyor. Bu, araştırmacıların Arxiv'de ön baskı olarak yayınlanan “Learning to Fly in Seconds” adlı bilimsel makalesinde gösterdiği gibi, saniyede beş aylık uçuşu simüle etmeyi mümkün kılıyor.

Simülasyonun bu kadar hızlı yapılabilmesi için bilim insanları çeşitli hileler kullanıyor. Sistemin simülasyonda yalnızca uçuş için kullanılabileceği şekilde eğitimi sürekli olarak geliştirmek yerine, araştırmacılar önceden bir çizgi çiziyor ve gerçek dünyada kullanım için yeterince iyi hale gelir gelmez eğitimi durduruyor.

Müfredat yöntemi


Araştırmacılar bu stratejiye bir tür takviyeli öğrenme müfredatı olan “müfredat” diyorlar. Müfredat daha az güçlü bir tutumla başlar. Daha sonra sistemi daha sağlam ve güvenilir hale getirmek için “cezalar” kademeli olarak artırılır. Bu özellikle etkili bir yöntemdir çünkü eğitimin yalnızca istenen sonuç elde edilene kadar yapılması gerekir – ne eksik ne fazla.


Önerilen editoryal içerik



İzniniz üzerine harici bir YouTube videosu (Google Ireland Limited) buraya yüklenecektir.



YouTube videosunu her zaman yükle

Şimdi YouTube videosunu indirin




Videoda quadcopter eğitiminin saniyeler içerisinde nasıl gerçekleştiği ve drone'un nasıl uçtuğu görülüyor.




Ayrıca bilim insanları, RL algoritmalarını verimlilik için ayarlayarak ve kullanılan M serisi MacBook'un donanım hızlandırmasından yararlanarak eğitimin hızını optimize etti. RL hattının verimli simülatör ve müfredat odaklı örnek verimliliği bir araya gelerek yalnızca 18 saniyelik çok hızlı bir eğitim süresi sağlar. Videoda kullanılan drone ile yine de birkaç dakika sürdü.

Bilim adamları sistemi, açık kaynaklı ve yeni aygıt yazılımıyla donatılabilen geleneksel açık kaynaklı bir quadcopter'e aktardılar. Araştırmacıların kullandığı 27 gramlık mini drone'nun maliyeti 200 dolar civarında. Ancak sistem diğer daha büyük ve daha pahalı drone'larda veya kendi kendine üretilen quadcopter'larda da kullanılabilir. Ancak eğitim süresi büyük oranda aynı kalıyor. Araştırmacıların kullandığı quadcopter, değişen rüzgar şartlarında bile istikrarlı bir süzülme uçuşu gerçekleştirebiliyor ve belirlenen uçuş manevralarını hassas bir şekilde yerine getirebiliyordu.

Araştırmacılar şu anda sistemi PX4 dronları için açık kaynaklı otopilota entegre etmek üzerinde çalışıyor. Otopilot genellikle daha küçük, otonom dronlar için kullanılır. Bilim adamları ayrıca sistemi farklı çevre koşullarına uyum sağlayabilecek şekilde daha da geliştirmek istiyorlar. Daha sonra farklı tipte drone’lar üzerinde çalışabilmeli ve onları kontrol edebilmeli.


(olb)



Haberin Sonu