İçerik
1. İnsan Robot Etkileşimi
İnsan robot etkileşimi, insanlar tarafından ve/veya insanlarla aynı ortamda kullanılan robotik sistemlerin, güvenli ve verimli bir çalışma için, nasıl bir tasarıma sahip olması gerektiğine odaklanan bir araştırma konusudur [1]. Bu kapsamda robotlar, insanı, insan gibi görerek, duyarak ve hissederek anlamaya çalışır. Bunun için robotlar görüntü işleme, ses tanıma ve temas sensörleri temelli yapay zeka algoritmalarını kullanır.
İnsan robot etkileşimi sistemleri doğası gereği gerçek zamanlı olarak çalışmak zorundadır. İnsandan gelen ‘dur’ mesajını 1 dakika sonra algılayıp cevap vermesi -1 dakika boyunca robotun hareketine devam etmesi- büyük güvenlik riskleri doğurur. Konunun daha iyi kavranılması adına Isaac Asimov’un, Durağan Döngü (1942) isimli hikayesinde, robotların ahlaki değerlerine değinirken tanımladığı üç robot yasasını örnek verelim:
1) Bir robot bir insana zarar veremez ya da bir insanın zarar görmesine seyirci kalamaz. (Peki bir insanın zarar göreceğini/gördüğünü gerçek zamanlı nasıl anlar?)
2) Bir robot birinci kural ile çelişmediği sürece bir insanın emirlerine uymak zorundadır. (Peki robot, insanların emirlerini gerçek zamanlı olarak nasıl alacak?)
3) Bir robot birinci ve ikinci kural ile çelişmediği sürece kendisinin zarar görmesine izin veremez. (Zarar göreceğini, gördüğünü gerçek zamanlı olarak nasıl anlar?)
1.1. İnsan Robot Etkileşimi Çalışmaları
İnsan robot etkileşimi çalışmalarının sınırlarını belirleme çabaları halen sürmektedir. Dördüncü sanayi devrimi akımıyla çalışmalar çoğunlukla fiziksel bir birlikteliğin olduğu etkileşimler üzerine yoğunlaşmıştır [2]. Yani etkileşimin olması için robot(lar) ve insan(lar)ın aynı zamanda, aynı yerde olması gerekmektedir. Bunun yanı sıra, bir de bu birlikteliğin nasıl bir ‘doğa’da olduğunun önemi vurgulanmaktadır. Örneğin, hep sabit bir yerde, tekrarlanan işler yapan bir robotun etkileşimi ile, hareketli, yaş almış insanların bakımı ile ilgili işler yapan robotların etkileşimi doğası gereği farklı olacaktır. Biz bu yazımızda endüstri de kullanılan insan robot sistemlerine odaklanıyoruz.
İnsan robot etkileşimi çalışmalarında sıklıkla kullanılan ve çoğunlukla anlam karmaşasına yol açan terimleri açıklamakta fayda var. Münih Teknik Üniversitesi’nden bir takım araştırmacı, insan robot etkileşiminin bir çatı terim olduğunu ve insanla robotun bir arada olmasını (coexistence), ortak çalışmasını (cooperation) ve iş birliğini (collaboration) kapsadığını belirtiyor ve bunların farklarını listeliyor [3]. Buna göre aşağıda yer alan çalışma metotlarının hepsi insan robot etkileşimi konusunun bir parçasıdır (Resim 1):
- Human Robot Coexistence (bir arada olma): İnsan ile robotun aynı zamanda, aynı çalışma alanında çalışması.
- Human Robot Cooperation (ortak çalışma): İnsan ile robotun aynı zamanda, aynı çalışma alanında ve aynı amaç için çalışması.
- Human Robot Collaboration (iş birliği): İnsan ile robotun aynı zamanda, aynı çalışma alanında, aynı amaç için fiziksel bir temas ile çalışması.

2. İnsan Robot Etkileşimi Teknikleri
İnsan ile robotun güvenli bir şekilde birlikte çalışabilmesi için, robot; insanı ve insandan gelen girdileri (insan niyetini – human intention) algılamaya ihtiyaç duyuyor. İnsan niyetini (human intention) anlamak ve tahmin etmek için çoğunlukla 3 teknik ve bu tekniklerin kombinasyonları olan multimodal teknik kullanılıyor.
2.1. Hareket/İşaret Tanımlama (Gesture Recognition)
Hareket/İşaret Tanımlama (Gesture Recognition) insan ile robot arasında bir iletişim metodudur: İnsanın yüz mimikleri, el-kol (uzuv) hareketleri ya da vücudunun duruş pozisyonu, görüntü temelli teknikler ya da giyilebilir cihazlar (sensörler) ile algılanabilir hale getirilebilir. Bu mesajları algılayan robot, mesaja özel görevler gerçekleştirebilir. Örneğin, sağ elini kaldırmış bir insan algıladığında anında tüm hareketlerini durdurabilir.
Hareket/İşaret Tanımlama (Gesture Recognition) tekniği, endüstri gibi gürültünün yoğun olduğu ortamlarda daha çok kullanılır. Ortam gürültüsü, Ses Tanıma (Speech Recognition) tekniklerinin verimini düşürebilmektedir.
Hareket/İşaret Tanımlama (Gesture Recognition) tekniği, görüntü temelli ve görüntü temelli olmayan metotlar olarak ikiye ayrılmaktadır.
2.1.1. Görüntü Temelli Hareket/İşaret Tanımlama (Image based Gesture Recognition)
Görüntü temelli Hareket/İşaret Tanımlama sensörleri Resim 2.‘de gösterilmektedir.

İşaretleyici (Marker) içeren sistemlerde normal bir optik kamera ile, insan üzerine yerleştirilmiş, boyutları bilinen işaretler ile 3 boyutlu izleme yapılabilmektedir. Optik işaretleyicilerin yanında, ışık ve/veya ısı yayan işaretçiler kullanılarak daha doğru sonuçlar elde edilebilir.
Derinlik sensörleri (dept sensor) ile takip edilmek istenen nesneye ışık gönderilir ve ışığın havada kalma süresi hesaplanır. Işık hızı da bilindiğinden belirli bir doğrulukla izlenen noktanın ne kadar derinlikte olduğu bilgisi elde edilerek hareket hakkında bilgi edilir. Bu yöntemde kullanılan kameralara ToF (Time of Flight) kameralar denir. Microsoft’un Kinect ürünü ise kızıl ötesi ışıklar, infrared kameralar kullanarak nesnenin (insanın) el/kol/uzuv hareketlerini tanımlar. Derinlik sensörleri, çoğunlukla 2 metreye kadar olan tanımlama tekniklerinde kullanılmaktadır.
Stereo kameralar (Stereo camera), aynı doğru üzerine yerleştirilmiş 2 adet optik kameradan oluşmaktadır. İki kamera kullanılması ile 2 boyutlu görüntünün yanında, derinlik bilgisini de elde ederek 3 boyutlu geometriler oluşturabilir.
Tekil kameralar (Single camera) ise, hareket tanımlama işlemini yapmakta en fazla zorlanan teknolojidir. Işık şiddeti değişimlerinden, titreşimlerden, blurlanmadan çok etkilenir ve derinlik bilgisini tek başına elde etmekte zorlanır. Bunları aşabilmek için daha yüksek görüntü akma hızıyla daha yüksek performanslı işlemciler kullanılmalıdır.
2.1.2. Görüntü Temelli olmayan Hareket/İşaret Tanımlama Sensörleri (Non Image based Gesture Recognition)
Görüntü temelli olmayan Hareket/İşaret Tanımlama sensörleri Resim 3.‘de gösterilmektedir.

Giyilebilir cihazlar (wearables) hareket tanımlamada çoğunlukla ivmeölçer, jiroskop ve manyetometre (Ataletsel Ölçüm Birimi – Inertial Measurement Unit) kullanır. Bu sensörlerden gelen verilerin füzyonu ile hareketin tanımlaması gerçekleştirilir. Her bir örneklemde, takip ettiği noktanın pozisyonunu/yönünü algılamaya çalışır. Bu sistemde hatalar kümülatif olarak arttığından sık sık kalibre edilmesi gerekir.
Radar dalgaları ile hareket tanımlama (Radar based recognition) sistemlerinin en güzel örneği Google projesi olan Project Soli‘dir.
Bu teknikte, nesneye radyo dalgaları gönderilerek yansıyan/soğrulan radyo enerjisi algılanır ve hareketin tanımlaması yapılır.
2.2. Ses Tanıma (Speech Recognition)
Ses tanıma (Speech Recognition), dil (konuşma) tanıma ve çevresel seslerin tanınması olarak ayrılır. Çevresel seslere, insan sesinden farklı olarak etraftaki cihazların sesleri, gök gürültüsü gibi sesler örnek verilebilir. İnsan Robot Etkileşim sistemlerinde Doğal Dil İşleme (Natural Language Processing – NLP) üzerine çalışmalar oldukça yoğunlaşmış ve ilerlemiştir. Günümüzde, cep telefonlarımızda da olduğu gibi, ‘Speech to text’ uygulamalarını kullanarak, sesimizi metine ve dolayısıyla robotların anlayabileceği mesajlara oldukça yüksek bir doğrulukla dönüştürebiliyoruz.
2.3. Fiziksel Temas Tanıma (Physical HRI)
İnsan ile robotun istemsiz teması, çoğunlukla ani robot duruşları gerektirir. Ani robot duruşları, robota iliştirilmiş kuvvet/tork sensörleri ile temas sırasında ya da kapasitif sensörler ile temastan hemen önce tespit edilebilir. Robot bu girdiye göre, planlanmış çıktıyı gerçekleştirir. Robotlar bir nesneye çarptığında, güç tüketiminde beklenmeyen bazı değişiklikler olacağından çarpma hissedilebilir ve planlanan işlem (robot durdurma) gerçekleştirilir.
2.4. Multimodal Teknik ile Tanımlama
Daha verimli ve güvenli çıktılar elde etmek amacıyla ses tanıma ve hareket tanımlama sistemlerinin birlikte kullanıldığı tekniktir.
3. Sonuç
Robotların gücüne ve doğruluğuna olan ihtiyaç sadece endüstride değil, sosyal hayatımızda da onlara duyduğumuz ihtiyacı artırmaktadır. Birçok işte, insanın zekası/çevikliği ile robotun gücü/doğruluğunun birlikte kullanılması o işte verimliliğin artmasına katkı sağlamaktadır. Hem verimli, hem güvenli çalışma için, robotun insanı algılaması ve insanın niyetlerini anlayabilmesi gerekmektedir. İnsan robot etkileşimi üzerine çalışmalar, yeni teknolojilerle yoğunluğunu artırarak devam edecektir.
Bundan sonraki yazımızda, insan robot etkileşim tekniklerinde kullanılan algoritmaları inceleyeceğiz.
4. Referanslar
1: Michael A. Goodrich and Alan C. Schultz (2008), “Human Robot Interaction: A Survey”, Foundations and Trends® in Human–Computer Interaction: Vol. 1: No. 3, pp 203-275. http://dx.doi.org/10.1561/1100000005
2: Dautenhahn, K., “Methodology & Themes of Human-Robot Interaction: A Growing Research Field”, 2007. https://doi.org/10.5772/5702
3: J. Schmidtler et al., “Human Centered Assistance Applications for the working environment of the future”, Occupational Ergonomics, September 2015.