زمانبندی و توزیع وظایف در سیستم‏های سرویس‏دهی مبتنی بر GPU بر اساس تقاضا

نام نویسنده (دانشجو):
محل دفاع: آمفی تئاتر شهید شهریاری
مقطع تحصیلی: کارشناسی ارشد
سمت استاد در پایان‌نامه: استاد راهنما

چکیده:

در طی سالهای اخیر، استفاده از منابع پردازش گرافیکی به دلیل قابلیت اجرای موازی کارها افزایش یافته است. همچنین به دلیل افزایش استفاده از سیستم‏های مبتنی بر یادگیری ماشین و یادگیری عمیق و قابلیت اجرای موازی این نوع از درخواست­ها، برای آموزش این دسته از مدلهای محاسباتی اغلب از پردازندههای گرافیکی به منظور افزایش عملکرد استفاده می‏گردد. به همین دلیل و در راستای استفاده بهینه از منابع پردازش گرافیکی موجود در این نوع از سرورها، مسئله زمانبندی درخواست‏ها به عنوان چالشی مطرح است. زمانبندی بهینه منابع بر روی سرورهای مبتنی بر GPU که برای وظایف موازی مناسب هستند، بسیار ضروری است. این منابع معمولاً دارای سرعت بالایی بوده و بنابراین هزینه بالایی نیز دارند. جهت استفاده بهینه از این منابع، مراکز ارائه دهنده خدمات، باید بتوانند به ازای هر درخواست، بهترین نوع ماشین مجازی، بهترین نوع پردازندهGPU و همچنین بهترین تعداد این نوع پردازنده را انتخاب نمایند. چنین مسئله‏ای، یک مسئله بهینه‏سازی نامیده می‏شود. پایان نامه حاضر، ضمن مدلسازی مسئله تخصیص منابع به عنوان یک مسئله بهینه‏سازی خطی، روش جدیدی را برای توزیع درخواست‏ها ارایه می‏دهد. روش پیشنهادی از یک صف مرکزی استفاده نموده و سپس درخواست‏ها را با استفاده از یک روش نوین توزیع درخواست، بین چندین صف محلی توزیع می‏کند. سپس وظایف موجود در هر صف محلی را‏ به صورت موازی زمانبندی و اجرا می‏کند. زمانبندی در هر صف محلی، تعیین می‏کند که به ازای هر درخواست: (1) بهترین نوع ماشین مجازی (2) بهترین نوع پردازنده GPU و (3) بهترین تعداد پردازنده‏های GPU کدام است. مقایسه روش پیشنهادی با آخرین روش‏های موجود، نشانگر کاهش زمان اجرا، کاهش زمان پاسخ و همچنین کاهش چشمگیر هزینه استفاده از منابع در روش پیشنهادی است و همچنین به دلیل اضافه شدن برخی هزینهها نظیر هزینه مهاجرت کد که در مقالات مشابه بررسی نشده است، انتظار می‏رود بتوان با در نظر گرفتن این موارد، الگوریتم­های موجود را بهبود بخشید.