پیش بینی عملکرد در آموزش برنامه های کاربردی یادگیری عمیق در سرویسهای ابری مبتنی بر GPU
چکیده:
مطابق نظر تحلیلگران داده، با افزایش استفاده از سرویسهای ابری، بازار GPU به عنوان یک سرویس (GPUaaS) برای پشتیبانی از مدلهای سهبعدی، بازی و آموزش مدلهای یادگیری عمیق رشد کرده است. ارائهدهندگان ابر در حال حاضر در کاتالوگهای خود ماشینهای مجازی با انواع و تعداد پردازندههای گرافیکی متفاوت ارائه میدهند. اغلب استفادهکنندگان از سرویسهای GPUaaS، وظایف مربوط به مرحله آموزش شبکههای یادگیری ماشین را جهت اجرا ارسال میکنند. این وظایف نیز به دلیل ماهیت اجرای موازی، به طور اختصاصی امکان اجرا بر روی سرورهای مبتنی بر GPU را دارند. بنابراین ارائهدهندگان سرویسهای ابری، میتوانند با دانستن اطلاعاتی در رابطه با وظایف ارسالی، تخصیص منابع را به صورت بهینه انجام دهند و کاربران نیز با دانستن مدت زمان مورد نیاز و هزینه نهایی، میتوانند انتخاب بهتری داشته باشند. اما دانستن مدت زمان اجرای وظایف آموزشی یادگیری ماشین، به طور قطع امکانپذیر نیست و وابسته به مواردی نظیر ویژگیهای شبکه عصبی و میزان منابع تخصیص یافته است. بنابراین میتوان زمان اجرای این وظایف را با توجه به ویژگیهای مطرح شده، پیشگویی کرد. روشهایی که تاکنون برای پیشگویی ارائه شدهاند، به منظور انتخاب ویژگیهای تأثیرگذار، از روشهای بهینهسازی استفاده میکنند که منجر به افزایش زمان آموزش و کاهش دقت پیشگویی میگردد. در این پژوهش به منظور بهبود معایب ذکر شده، روش DG-LR برای پیشبینی زمان آموزش شبکههای عصبی پیشنهاد شده است که دارای دو مرحله اصلی است. ابتدا با استفاده از گرافهای غیرقطعی، ویژگیهای ضروری را استخراج میکند و سپس به کمک الگوریتم رگرسیون خطی، مدلی را برای پیشگویی از روی دادههای پیشین ارائه میدهد. نتایج ارزیابی نشانگر بهبود میزان دقت و کاهش زمان آموزش و اجرای روش پیشنهادی در مقایسه با روشهای پیشین است.