محققان دانشگاه پلیتکنیک فدرال لوزان (EPFL) در سوئیس و دانشگاه تگزاس در آستین (UT) یک رابط مغز و کامپیوتر (BCI) توسعه دادهاند که به کاربران اجازه میدهد مسیر حرکت یک دستکاری کننده ربات را تغییر دهند. این سیستم از یادگیری تقویت معکوس (IRL) استفاده می کند و می تواند ترجیحات کاربر را از کمتر از پنج نمایش یاد بگیرد.
این سیستم و مجموعهای از آزمایشها در مقالهای که در مجله Nature’s Communications Biology منتشر شد، توضیح داده شد. هدف از این تحقیق کمک به بیماران فلج با توسعه ربات های کمکی بود که می توانند با استفاده از BCI کنترل شوند. این تیم سیگنالهای الکتروانسفالوگرام (EEG) و الکترواکولوگرام (EOG) را از کاربران ضبط کردند، در حالی که آنها به یک دستکاری ربات با جوی استیک فرمان میدادند. نرم افزار ربات شامل یک روال نیمه مستقل اجتناب از موانع بود. پارامترهای روال با استفاده از IRL بر اساس پتانسیل های مرتبط با خطا به روز شد: سیگنال هایی که از سیگنال های EEG و EOG رمزگشایی می شوند، به موجب آن ربات یاد می گیرد که چگونه می تواند به یک مانع شکننده نزدیک شود بدون اینکه کاربر را ناراحت کند. به گفته محقق ارشد آد بیلارد،
کمک ربات ها می تواند به [افراد مبتلا به آسیب نخاعی] کمک کند تا بخشی از مهارت از دست رفته خود را بازیابی کنند، زیرا ربات می تواند وظایف را در جای خود انجام دهد.
دستگاههای BCI معمولاً فعالیت عصبی را با استفاده از ایمپلنتهای داخلی یا حسگرهای خارجی مانند الکترودهای EEG اندازهگیری میکنند. هدف این است که این دادههای حسگر را به سیگنالی تبدیل کنیم که بتوان از آن به عنوان ورودی رایانه استفاده کرد، به طوری که کاربران میتوانند یک رایانه یا ربات را برای انجام کارهایی که کاربر از نظر فیزیکی قادر به انجام آنها نیست، کنترل کنند. این اغلب نیاز به کاربر دارد که انجام یک فعالیت بدنی را تصور کند، که منجر به فعالیت عصبی می شود که BCI می تواند آن را شناسایی کرده و به ورودی کامپیوتر تبدیل کند.
از آنجایی که فرمان دادن مستقیم به یک ربات دستکاری کننده از طریق BCI می تواند زمان بر و خسته کننده باشد، زیرا کاربر باید دائماً “کنترل” داشته باشد، تیم بیلارد تصمیم گرفتند تا بررسی کنند که چگونه می توان از BCI برای تنظیم رفتار یک دستگاه نیمه مستقل استفاده کرد. دستکاری ربات به طور خاص، سیستم الگوریتم اجتناب از مانع ربات را در پاسخ به پتانسیل های مرتبط با خطا (ErrP) کاربر تنظیم می کند: سیگنال های EEG که زمانی که ربات به یک مانع نزدیکتر از آنچه کاربر انتظار دارد، شناسایی و رمزگشایی می شود.
برای انجام این تنظیم، محققان یک الگوریتم آموزشی IRL را پیاده سازی کردند. برخلاف الگوریتمهای معمولی RL، که در آن رفتار عامل یادگیری با یک تابع پاداش نمرهگذاری میشود، IRL هم تابع پاداش و هم عملکرد بهینه را از مجموعهای از نمایشها میآموزد. این تظاهرات توسط کاربرانی انجام شد که یک ربات دستکاری کننده را از طریق یک جوی استیک هدایت می کردند تا در فضای کاری که حاوی یک مانع شکننده است به سمت راست یا چپ حرکت کند. با نزدیک شدن دستکاری کننده به مانع، ربات سعی می کند از مانع اجتناب کند. اگر کاربر پیش بینی می کرد که ربات از مانع اجتناب نمی کند، سیگنال ErrP شناسایی شده توسط BCI برای تنظیم تابع پاداش و پارامترهای اجتناب از مانع استفاده می شود.
در مجموعهای از آزمایشها، محققان دریافتند که سیستم آنها میتواند عملکرد پاداش کاربر را در کمتر از سه نمایش شناسایی کند. آنها همچنین خاطرنشان کردند که رویکرد آنها “محکم برای تغییرپذیری طبیعی و عملکرد زیر بهینه رمزگشا ErrP” است، یک ویژگی مفید، زیرا سنجش EEG می تواند نویز باشد.
استفاده از تکنیک های یادگیری ماشین برای بهبود دستگاه های BCI یک حوزه تحقیقاتی فعال است. در سال 2019، InfoQ از تلاشهای متعدد محققان دانشگاه برای استفاده از سیگنالهای مغزی برای سنتز گفتار و همچنین دستگاه فیسبوک Reality Lab گزارش داد که به کاربران اجازه میدهد با تصور کردن خودشان در حال صحبت کردن، «تایپ» کنند. در سال 2021، InfoQ یک BCI بی سیم را پوشش داد که به کاربران امکان کنترل یک بازی ویدیویی را می داد.
منبع: infoq
Parsaland Trading Company with many activities in the fields of import and export, investment consulting, blockchain consulting, information technology and building construction