واحد پردازش گرافیک (Graphics processing unit)

واحد پردازش گرافیکی (GPU) یک مدار الکترونیکی تخصصی است که برای پردازش تصویر دیجیتال و سرعت بخشیدن به گرافیک کامپیوتری طراحی شده است.

یک واحد پردازش گرافیکی (GPU) نشان دهنده یک مدار الکترونیکی تخصصی است که برای پردازش تصویر دیجیتال و تسریع گرافیک کامپیوتری مهندسی شده است. این واحدها یا به‌عنوان اجزای مجزا روی کارت‌های گرافیکی یا در مادربردها، تلفن‌های همراه، رایانه‌های شخصی، ایستگاه‌های کاری و کنسول‌های بازی تعبیه شده‌اند. علاوه بر این، پردازنده‌های گرافیکی به طور فزاینده‌ای در پردازش هوش مصنوعی (AI) استفاده می‌شوند و از قابلیت‌های خود در شتاب جبر خطی استفاده می‌کنند، تکنیکی که برای پردازش گرافیکی نیز اساسی است.

در حالی که یک تعریف منحصر به فرد برای این واژه مبهم باقی می‌ماند، و می‌تواند به طور کلی هر سیستم نمایش ویدیویی را در بر بگیرد، اما ظرفیت گرافیکی فشرده‌ای داخلی را برای ما تعریف می‌کند. عملیات، مانند چرخش و مقیاس بندی تصاویر سه بعدی. اغلب، GPU ها از اجرای برنامه های سفارشی به نام shader نیز پشتیبانی می کنند. این عملکرد آنها را از کنترل‌کننده‌های گرافیکی قبلی، به‌ویژه کنترل‌کننده‌های نمایشگر ویدیویی، که فاقد قابلیت‌های محاسباتی داخلی هستند، و blitters، که محدود به عملیات انتقال حافظه اساسی بودند، متمایز می‌کند. GPU مدرن در دهه 1990 تکامل یافت و در ابتدا توانایی رندر خطوط و متن مستقل از واحد پردازش مرکزی (CPU) و متعاقباً یکپارچه‌سازی قابلیت‌های سه بعدی را داشت.

استقلال ذاتی توابع گرافیکی اجرای آنها را در موتورهای محاسباتی متمایز تسهیل می‌کند. پردازنده‌های گرافیکی معاصر صدها یا حتی هزاران واحد پردازشی را در خود جای داده‌اند. این معماری موازی آنها را برای محاسبات غیر گرافیکی که شامل مشکلات موازی شرم آور است بسیار موثر می کند. ظرفیت پردازنده‌های گرافیکی برای اجرای محاسبات متعدد به سرعت باعث ادغام آن‌ها در حوزه‌های مختلف، به‌ویژه هوش مصنوعی (AI) شده است، جایی که آن‌ها عملکرد استثنایی در مدیریت وظایف محاسباتی فشرده و سخت‌گیرانه از خود نشان می‌دهند. برنامه‌های غیر گرافیکی اضافی شامل آموزش شبکه عصبی و استخراج ارزهای دیجیتال است.

تاریخچه

دهه 1960

منشا سخت‌افزار گرافیک سه بعدی اختصاصی را می‌توان در پایانه‌های گرافیکی مانند Adage AGT-30 که در سال 1967 معرفی شد، که دارای پردازنده‌های ماتریس آنالوگ بود، ردیابی کرد. در سال 1969، Evans & ساترلند (E&S) از سیستم ترسیم خط-1 (LDS-1) پرده برداری کرد که به عنوان اولین سیستم تمام دیجیتالی با قابلیت ضرب ماتریس قابل توجه است. همزمان در سال 1969، IMLAC PDS-1، یک پایانه گرافیکی مقرون به صرفه، راه اندازی شد. این سیستم متعاقباً به عنوان یک پلتفرم اولیه برای بازی‌های سه‌بعدی عمل کرد که نمونه‌ای از آن عناوینی مانند Maze War بود.

دهه 1970

در قلمرو سخت‌افزار حرفه‌ای، سیستم PLATO IV در دانشگاه ایلینویز Urbana-Champaign در سال 1972 شروع به کار کرد. تقریباً از سال 1973 تا 1978، کاربران این سیستم چندین بازی سه‌بعدی وایرفریم چند نفره شبکه‌ای را توسعه داده و رایج کردند. همچنین در سال 1972، سیستم "جعبه Watkins" E&S Continuous Tone 1 (CT1)، شامل یک E&S LDS-2 و یک سیستم تصویر سایه دار، در دانشگاه Case Western Reserve مستقر شد و اولین سایه زنی Gouraud در زمان واقعی را معرفی کرد. در سال 1975، یک تلاش مشترک بین Evans & شرکت کامپیوتری ساترلند و بخش گرافیک کامپیوتری دانشگاه یوتا، فریم بافر ویدئویی MOSFET پیشگام را تولید کردند که از رنگ و سایه صاف پشتیبانی می کرد. سیستم E&S Continuous Tone 3 (CT3) که در سال 1977 برای آموزش خلبانی از طریق شبیه سازی کامپیوتری به لوفت هانزا تحویل داده شد، نشان دهنده اولین سیستم گرافیکی با قابلیت نقشه برداری بافت در زمان واقعی بود. در اواخر دهه 1970، آیکناس سیستم‌های گرافیکی با گرافیک 8 بیتی و 24 بیتی را در کنار شتاب سه بعدی تولید کرد.

از دهه 1970، بردهای سیستم آرکید مدارهای گرافیکی دو بعدی تخصصی را در خود جای داده‌اند. در مراحل ابتدایی سخت‌افزار بازی‌های ویدیویی، هزینه بالای RAM برای بافرهای فریم ایجاب می‌کرد که تراشه‌های ویدیویی داده‌های ترکیبی را در طول فرآیند اسکن نمایش بر روی مانیتور انجام دهند.

مدار شیفتر لوله اختصاصی، انیمیشن گرافیک‌های فریم‌بافر CPU را برای بازی‌های ویدیویی آرکید متعدد دهه 1970 که توسط Midway و Taito توسعه یافته بودند، تسهیل کرد، از جمله Gun Fight (1975)، Sea Wolf (1976)، و Space Invaders. در سال 1979، سیستم آرکید Namco Galaxian سخت‌افزار گرافیکی تخصصی را ادغام کرد که از رنگ‌های RGB، اسپرایت‌های چند رنگ و پس‌زمینه‌های نقشه کاشی پشتیبانی می‌کرد. سخت‌افزار Galaxian در دوران طلایی بازی‌های ویدیویی آرکید که توسط شرکت‌های برجسته‌ای مانند Namco، Centuri، Gremlin، Irem، Konami، Midway، Nichibutsu، Sega و Taito استفاده می‌شد، به طور گسترده مورد استفاده قرار گرفت.

در سال 1977، کنسول آتاری 2600 از یک تغییر دهنده ویدیو به نام آداپتور رابط تلویزیونی استفاده کرد. متعاقباً، کامپیوترهای 8 بیتی آتاری، که در سال 1979 معرفی شدند، ANTIC، یک پردازنده ویدئویی اختصاصی را در خود جای دادند. ANTIC یک "فهرست نمایش" را تفسیر کرد که نحوه نگاشت خطوط اسکن به حالت های بیت مپ یا کاراکتر خاص و مدیریت ذخیره سازی حافظه را تعریف می کرد، در نتیجه نیاز به یک بافر فریم پیوسته را حذف می کرد. علاوه بر این، این پردازنده اجرای 6502 زیرروال کد ماشین را در خطوط اسکن خاص با فعال کردن یک بیت تعیین شده در دستورالعمل لیست نمایش، فعال کرد. ANTIC همچنین پیمایش عمودی و افقی مستقل را تسهیل می‌کند که توسط واحد پردازش مرکزی تخلیه می‌شود.

دهه 1980

دهه 1980 با پیشرفت های قابل توجهی در سخت افزار گرافیک سه بعدی حرفه ای مشخص شد. یکی از پیشرفت‌های بسیار مهم، ایجاد موتور هندسه در سال 1981 بود، یک پردازنده برداری بردار یکپارچه‌سازی در مقیاس بسیار بزرگ (VLSI)، مدار مجتمع ویژه برنامه (ASIC)، که توسط جیم کلارک و مارک هانا در دانشگاه استنفورد طراحی شد. این پردازنده به عنوان پیشروی برای هسته های تانسوری معاصر و پردازنده های مشابه مورد استفاده در گرافیک و برنامه های هوش مصنوعی شناخته می شود. موتور Geometry متعاقباً برای مدت طولانی در ایستگاه های کاری Silicon Graphics ادغام شد. محصول افتتاحیه Silicon Graphics، ترمینال IRIS 1000، که در نوامبر 1983 عرضه شد، دارای گرافیک سه بعدی با شتاب سخت افزاری بود که توسط Geometry Engine طراحی شده بود. این پردازنده نوآورانه توانایی پردازش تقریباً 6 میلیون عملیات در ثانیه را نشان داد.

NEC μPD7220 اجرای افتتاحیه یک پردازنده نمایشگر گرافیکی رایانه شخصی را به عنوان یک تراشه مدار مجتمع یکپارچه مقیاس بزرگ (LSI) نشان داد. این نوآوری توسعه کارت‌های گرافیکی مقرون‌به‌صرفه و با کارایی بالا را تسهیل کرد که نمونه‌ای از آن‌ها از فناوری بصری Number Nine بود. تا اواسط دهه 1980 به عنوان شناخته شده ترین واحد پردازش گرافیکی (GPU) شهرت یافت. به عنوان اولین پردازشگر نمایشگر گرافیکی کاملاً یکپارچه با مقیاس بسیار بزرگ (VLSI) فلز اکسید-نیمه هادی (NMOS) برای رایانه های شخصی، رزولوشن تا 1024×1024 را پشتیبانی کرد و زمینه را برای بازار گرافیک رایانه شخصی ایجاد کرد. μPD7220 در کارت‌های گرافیکی متعددی گنجانده شد و متعاقباً مجوز طراحی‌های سازگار دریافت کرد، از جمله Intel 82720، که نشان‌دهنده ورود اولیه اینتل به واحدهای پردازش گرافیکی بود. همزمان، بازی‌های آرکید ویلیامز الکترونیک 1982، Robotron: 2084، Joust، Sinistar و Bubbles، هر کدام دارای تراشه‌های blitter سفارشی بودند که برای دستکاری نقشه‌های بیتی 16 رنگی، ARTC4>

طراحی شده‌اند. HD63484، که اولین پردازنده گرافیکی مهم مکمل فلز-اکسید-نیمه هادی (CMOS) برای رایانه های شخصی شد. ARTC می‌توانست هنگام کار در حالت تک رنگ، وضوح تصویر تا 4K را ارائه دهد. در اواخر دهه 1980 به طور گسترده در کارت های گرافیک و پایانه های مختلف مورد استفاده قرار گرفت.

آمیگا که در سال 1985 راه اندازی شد، با یک تراشه گرافیکی اختصاصی به نام Agnus معرفی شد. این تراشه دارای یک blitter بود که دستکاری بیت مپ، ترسیم خط و عملیات پر کردن ناحیه را تسهیل می کرد. علاوه بر این، آگنوس یک پردازنده کمکی مجهز به مجموعه دستورالعمل ساده خود را ارائه کرد. این پردازنده کمکی قادر به دستکاری همزمان ثبت‌های سخت‌افزار گرافیکی با پرتو ویدئو بود، و قابلیت‌هایی مانند سوئیچ‌های پالت در هر اسکن، مالتی‌پلکس کردن اسپرایت و پنجره‌سازی سخت‌افزار را ممکن می‌کرد، یا می‌توانست مستقیماً تابش را کنترل کند.

همچنین در سال 1985، IBM کنترلگر گرافیکی حرفه ای را معرفی کرد که یک کارت گرافیک سه بعدی پایه بود. وضوح تصویر 640 × 480 را با گرافیک 256 رنگ ارائه می‌کرد و از یک CPU اختصاصی برای ارائه خودکار گرافیک از سیستم اصلی استفاده می‌کرد. این کنترل‌کننده به‌عنوان پایه‌ای معماری برای کارت‌های تولید شده توسط تولیدکنندگان مختلف، از جمله Matrox، عمل می‌کرد و سیگنال‌های RGB آنالوگ آن مستقیماً بر توسعه استاندارد ویدئویی VGA تأثیر گذاشت.

در سال 1986، Texas Instruments از TMS34010 رونمایی کرد که خود را به عنوان اولین پردازنده گرافیکی کاملاً قابل برنامه‌ریزی متمایز کرد. این پردازنده توانایی اجرای کدهای همه منظوره را داشت و در عین حال دارای یک مجموعه دستورالعمل تخصصی گرافیک محور بود. از سال 1990 تا 1992، این تراشه متعاقباً هسته کارت‌های شتاب دهنده ویندوز معماری گرافیک تگزاس اینسترومنتز ("TIGA") را تشکیل داد.

متعاقباً، در سال 1987، IBM سیستم گرافیکی 8514 را معرفی کرد. این سیستم خود را به‌عنوان یکی از کارت‌های ویدئویی اولیه برای رایانه‌های شخصی IBM برای پیاده‌سازی اولیه‌های دوبعدی با عملکرد ثابت به‌طور مستقیم در سخت‌افزار الکترونیکی متمایز کرد. همچنین در سال 1987، کامپیوتر X68000 شارپ یک چیپست گرافیکی سفارشی را در خود جای داد که یک پالت 65536 رنگ ارائه می‌کرد و شتاب سخت‌افزاری برای اسپرایت‌ها، اسکرول و چندین زمین بازی فراهم می‌کرد. این دستگاه به طور مشخص به عنوان پلت فرم توسعه برای برد آرکید سیستم CP Capcom عمل می کرد. دو سال بعد، در سال 1989، کامپیوتر FM Towns فوجیتسو از یک پالت 16777216 رنگ پشتیبانی کرد.

در سال 1987، IBM سیستم نمایشگر آرایه گرافیکی ویدئویی (VGA) خود را معرفی کرد که از حداکثر وضوح 640 × 480 پیکسل پشتیبانی می کرد. برخلاف 8514/A، VGA فاقد قابلیت های شتاب سخت افزاری بود. در نوامبر 1988، NEC Home Electronics انجمن استانداردهای الکترونیک ویدئویی (VESA) را برای توسعه و ترویج Super VGA (SVGA) به عنوان یک استاندارد نمایشگر کامپیوتری جانشین VGA تأسیس کرد. وضوح صفحه نمایش Super VGA تا رسیدن به 800 × 600 پیکسل پشتیبانی می‌کند که نشان‌دهنده افزایش 56 درصدی وضوح است.

در طول سال 1988، SGI سیستم‌های IRIS1 را مجهز به سیستم‌های Engine20 و IRIS Engine20 و 1graph معرفی کرد. متعاقباً برد الحاقی IrisVision را نیز بر اساس موتور هندسه، برای سیستم‌های گذرگاه MicroChannel IBM (RS/6000) راه‌اندازی کرد.

هم‌زمان در سال 1988، Namco System 21 و Taito Air System معرفی شدند که دارای تابلوهای 3 بعدی در دستگاه‌های چند ضلعی اختصاصی >p هستند.

دهه 1990

دهه 1990 شاهد پیشرفت قابل توجهی در سخت افزارهای گرافیکی سه بعدی ایستگاه کاری حرفه ای از Sun Microsystems، SGI و سایر سازندگان بود. معرفی OpenGL توسط SGI در سال 1992 پایه و اساس رابط های برنامه نویسی سه بعدی استاندارد شده و مستقل از سخت افزار را ایجاد کرد. با این وجود، در اواسط تا اواخر دهه 1990، سخت افزارهای حرفه ای به تدریج تحت الشعاع محصولات مصرفی قرار گرفتند. این پیشنهادات مصرف‌کننده عملکرد قابل مقایسه یا برتری را، به‌ویژه در مورد نقشه‌برداری بافت، با هزینه کمتر و در پلت‌فرم‌هایی که برای کاربران نهایی قابل دسترس‌تر بود، ارائه می‌کردند.

در سال 1991، S3 Graphics S3 86C911 را معرفی کرد که توسط طراحان آن پس از Porsche 911 نامگذاری شد تا نشان‌دهنده بهبود عملکرد مورد انتظار آن باشد. 86C911 الهام گرفته از تقلیدهای متعدد. تا سال 1995، تمام سازندگان برجسته تراشه‌های گرافیکی رایانه شخصی، قابلیت‌های شتاب دوبعدی را در محصولات خود ادغام کردند. شتاب‌دهنده‌های ویندوز با کارکرد ثابت متعاقباً از پردازنده‌های گرافیکی پرهزینه همه منظوره در محیط‌های ویندوز بهتر عمل کردند که منجر به منسوخ شدن دومی در بازار رایانه‌های شخصی شد.

در اوایل تا اواسط دهه 1990، تکثیر گرافیک‌های سه‌بعدی بلادرنگ در بازی‌های آرکید، رایانه و کنسول باعث افزایش تقاضای مصرف‌کنندگان برای راه‌حل‌های گرافیکی سه‌بعدی با شتاب سخت‌افزاری شد. نمونه‌های پیشگامی از سخت‌افزار گرافیک سه‌بعدی در بازار انبوه در بردهای سیستم آرکید، از جمله Sega Model 1، Namco System 22، و Sega Model 2، و همچنین در کنسول‌های بازی ویدیویی نسل پنجم مانند Saturn، PlayStation، و Nintendo 64 ظاهر شد. Magic Edge Hornet Simulator، که در سال 1993 معرفی شد، سال‌ها قبل از ادغام آنها در کارت‌های گرافیک مصرف‌کننده، قابلیت‌های T&L (تبدیل، برش و نورپردازی) را با شتاب سخت‌افزاری ارائه می‌کرد. یک نوآوری اولیه اضافی، تراشه Super FX بود، یک پردازنده گرافیکی مبتنی بر RISC که در کارتریج های بازی SNES تعبیه شده بود، که به طور برجسته در عناوینی مانند Doom و Star Fox استفاده می شد. سیستم‌های خاصی از پردازنده‌های سیگنال دیجیتال (DSP) برای تسریع تحولات استفاده می‌کنند. فوجیتسو، یکی از مشارکت‌کنندگان در سیستم آرکید سگا مدل 2، در سال 1995 تلاش‌هایی را برای ادغام T&L در راه‌حل یکپارچه ادغام مقیاس بزرگ (LSI) برای رایانه‌های شخصی آغاز کرد. این تلاش در Fujitsu Pinolite، اولین پردازنده هندسه سه بعدی برای رایانه های شخصی، که در سال 1997 رونمایی شد، به اوج خود رسید. Reality Coprocessor Nintendo 64، که در سال 1996 راه اندازی شد، نشان دهنده افتتاحیه سخت افزار T&L GPU برای کنسول های بازی ویدیویی خانگی بود. متعاقباً، در سال 1997، میتسوبیشی 3Dpro/2MP را معرفی کرد، یک GPU که قابلیت تبدیل و روشنایی را برای ایستگاه های کاری و دسکتاپ های ویندوز NT ارائه می دهد. ATi این فناوری را در کارت گرافیک FireGL 4000 خود، که در سال 1997 نیز منتشر شد، وارد کرد.

نام اختصاری "GPU" توسط سونی ابداع شد، به طور خاص به پردازنده گرافیکی 32 بیتی سونی (مهندسی توشیبا) ادغام شده در کنسول بازی ویدیویی پلی استیشن، که در سال 1994 معرفی شد.

دهه 2000

در اکتبر 2002، راه اندازی ATI Radeon 9700 (همچنین با نام R300) که به عنوان شتاب دهنده افتتاحیه Direct3D 9.0 در جهان شناخته شد، سایه زن های پیکسل و رأس را قادر به اجرای محاسبات ممیز شناور تکراری و گسترده کرد. این سایه‌زن‌ها به سرعت به انعطاف‌پذیری CPUها نزدیک شدند و در عین حال سرعت بیشتری را برای پردازش آرایه تصویر ارائه می‌کردند. سایه‌زنی پیکسلی اغلب برای نگاشت برآمدگی استفاده می‌شود، تکنیکی که از بافت برای رندر کردن اجسام با ظاهرهای متنوع، مانند سطوح براق، کسل‌کننده، ناهموار، گرد یا اکسترود شده استفاده می‌کند.

با معرفی سری Nvidia GeForce 8 و واحدهای پردازش جریان عمومی جدید، واحدهای پردازش گرافیکی (GPU) به دستگاه‌های محاسباتی تعمیم‌یافته‌تر تبدیل شدند. GPUهای موازی به تدریج واحدهای پردازش مرکزی (CPU) را در وظایف محاسباتی به چالش کشیده اند و یک حوزه تحقیقاتی تخصصی به نام محاسبات GPU یا GPGPU، مخفف محاسبات با هدف عمومی در GPU را تقویت کرده اند. این زمینه کاربردهای متنوعی از جمله یادگیری ماشینی، اکتشاف نفت، پردازش تصویر علمی، جبر خطی، آمار، بازسازی سه بعدی و قیمت گذاری گزینه های سهام را به همراه داشته است. GPGPU ها به عنوان پیشینیان پایه ای برای سایه زن های محاسباتی معاصر (مانند CUDA، OpenCL، DirectCompute) عمل کردند، در ابتدا از سخت افزار به شیوه ای غیر متعارف با تفسیر داده های الگوریتمی به عنوان نقشه های بافت و اجرای الگوریتم ها از طریق رندر مثلث یا چهارگوش با یک پیکسل مناسب استفاده می کردند. این رویکرد ذاتاً هزینه های عملیاتی را معرفی کرد، زیرا اجزایی مانند مبدل اسکن به طور غیرضروری درگیر می شدند، و دستکاری های مثلثی به جز برای تنها هدف فراخوانی سایه زن پیکسل بی ربط بودند.

پلتفرم CUDA توسط انویدیا، که در سال 2007 راه اندازی شد، نشان دهنده اولین برنامه به طور گسترده برای برنامه نویسی برنامه نویسی بود. برعکس، OpenCL، یک استاندارد باز ایجاد شده توسط گروه Khronos، توسعه کدهای سازگار با GPU و CPU را تسهیل می‌کند و قابلیت حمل بین پلتفرم را در اولویت قرار می‌دهد. پیاده سازی های OpenCL از بازیگران اصلی صنعت، از جمله Intel، AMD، Nvidia و ARM پشتیبانی می شوند. گزارش سال 2011 توسط Evans Data نشان داد که OpenCL به عنوان دومین ابزار رایج در محاسبات با عملکرد بالا (HPC) ظاهر شده است.

2010

در سال 2010، انویدیا با آئودی همکاری کرد تا پردازنده‌های گرافیکی Tegra را در داشبورد خودرو ادغام کند و بدین ترتیب عملکرد سیستم‌های ناوبری و سرگرمی خودرو را افزایش دهد. به طور همزمان، پیشرفت در فناوری GPU در بخش خودرو کمک قابل توجهی به پیشرفت قابلیت های خودران کرد. AMD کارت‌های گرافیک سری Radeon HD 6000 خود را در سال 2010 معرفی کرد و به دنبال آن پردازنده‌های گرافیکی مجزای سری 6000M برای پلتفرم‌های موبایل در سال 2011 عرضه شد. ویژگی های قابل توجه ریزمعماری پردازنده گرافیکی Kepler شامل GPU Boost، فناوری طراحی شده برای تنظیم پویا سرعت ساعت کارت گرافیک بر اساس مصرف انرژی آن، و NVENC، یک فناوری اختصاصی شتاب رمزگذاری ویدئو است.

در سال 2013، کنسول های پلی استیشن 4 و ایکس باکس وان منتشر شدند که هر دو از کنسول های AMD8 و AMD7 5 استفاده می کردند. 7790 معماری. سری پردازنده‌های گرافیکی Kepler انویدیا توسط خط Maxwell که از فرآیند تولید یکسانی استفاده می‌کردند، جایگزین شد. تراشه‌های 28 نانومتری انویدیا توسط TSMC در تایوان ساخته شده‌اند و از فرآیند 28 نانومتری استفاده می‌کنند که در مقایسه با فناوری قبلی 40 نانومتری، عملکرد 20 درصدی را در کنار کاهش مصرف انرژی به همراه داشت. هدست‌های واقعیت مجازی، پس از عرضه اولیه، نیاز به مشخصات سیستم قابل‌توجهی داشتند و سازندگان پردازنده‌های گرافیکی مانند GTX 970 یا R9 290X یا مدل‌های برتر را توصیه می‌کردند. کارت‌های گرافیکی مبتنی بر ریزمعماری پاسکال در سال 2016 معرفی شدند که شامل سری GeForce 10 است. این کارت‌ها با استفاده از فرآیند ساخت 16 نانومتری تولید شده‌اند که نشان‌دهنده پیشرفت قابل‌توجهی نسبت به ریزمعماری‌های قبلی است.

در سال 2018، انویدیا پردازنده‌های گرافیکی سری RTX 20 را معرفی کرد که هسته‌های اختصاصی ردیابی پرتو را یکپارچه می‌کردند و قابلیت‌های ردیابی پرتو در زمان واقعی را در سخت‌افزار درجه مصرف‌کننده امکان‌پذیر می‌کردند. همزمان، پردازنده‌های گرافیکی Polaris 11 و Polaris 10 AMD با استفاده از فرآیند 14 نانومتری تولید شدند که منجر به بهبود قابل‌توجهی در معیار عملکرد بر وات کارت‌های ویدئویی AMD شد. AMD در ادامه سری گرافیک‌های Vega را راه‌اندازی کرد و بازار گران‌قیمت را به عنوان رقیب مستقیم کارت‌های پاسکال رده بالای انویدیا هدف قرار داد و به ویژه دارای حافظه باند پهنای باند 2 (HBM2)، شبیه به Titan V.

در سال 2019، AMD RDNA، جانشین مجموعه microarch (GraphicsChone و ساختار بعدی) خود را معرفی کرد. سری کارت‌های گرافیک Radeon RX 5000 اولین محصولاتی هستند که از آن استفاده می‌کنند. متعاقباً این شرکت اعلام کرد که تکرار بعدی ریزمعماری RDNA یک "بازسازی" افزایشی را تشکیل خواهد داد. AMD بعداً از سری Radeon RX 6000 پرده برداری کرد که معماری گرافیکی RDNA 2 را در خود جای داده بود و از ردیابی پرتو با شتاب سخت افزاری پشتیبانی می کرد. این سری محصول که در اواخر سال 2020 عرضه شد، شامل RX 6800، RX 6800 XT و RX 6900 XT بود. RX 6700 XT، بر اساس معماری Navi 22، در اوایل سال 2021 عرضه شد.

پلی‌استیشن 5، ایکس‌باکس سری ایکس و ایکس‌باکس سری اس، که همگی در سال 2020 منتشر شدند، پردازنده‌های گرافیکی مبتنی بر ریزمعماری RDNA 2 را یکپارچه می‌کنند، و دارای تنظیمات و پیکربندی‌های افزایشی در سیستم‌های GPU و تغییرات جزئی PU هستند. اجرا.

2020

در طول دهه 2020، واحدهای پردازش گرافیکی (GPU) شاهد پذیرش فزاینده‌ای برای محاسبات مربوط به مشکلات بسیار موازی‌پذیر، به‌ویژه آموزش شبکه‌های عصبی بر روی مجموعه داده‌های گسترده ضروری برای مدل‌های زبان بزرگ هوش مصنوعی بوده‌اند. اکثر پردازنده‌های گرافیکی معاصر دارای هسته‌های پردازشی تخصصی هستند که برای یادگیری عمیق طراحی شده‌اند، که عملکرد FLOPS را از طریق عملیات ضرب و تقسیم ماتریس 4×4 به طور قابل‌توجهی افزایش می‌دهند. پیاده‌سازی‌های اولیه، نمونه‌ای از ریزمعماری Volta انویدیا، که در سال 2017 معرفی شد، نشان داد که سطوح عملکردی به 128 TFLOPS در برنامه‌های خاص می‌رسد.

متعاقبا، هسته‌های شتاب هوش مصنوعی به یک ویژگی رایج در ریزمعماری‌های مصرف‌کننده و ایستگاه‌های کاری با ریزمعماری‌های N210's، ریزمعماری N210', commens، تبدیل شدند. جایی که آنها به عنوان هسته های Tensor تعیین شدند. این هسته‌ها که در ابتدا برای Deep Learning Super Sampling (DLSS) به منظور افزایش عملکرد بازی و بهبود وفاداری تصویر مستقر شدند، از آن زمان در نرم‌افزار Broadcast Nvidia ادغام شده‌اند و قابلیت‌های مختلف مبتنی بر هوش مصنوعی مانند فیلتر صدا و کاهش نویز ویدیو را ممکن می‌سازند.

AMD متعاقباً هسته‌های مشابه "Matrix" خود را در معماری RDNA 3 خود برای محصولات مصرفی ادغام کرد، در حالی که اینتل هسته‌های معادل "XMX" خود را در تمام پردازنده‌های گرافیکی Arc، با ریزمعماری Alchemist ترکیب کرد.

سازندگان GPU

شرکت‌های متعددی پردازنده‌های گرافیکی تولید کرده‌اند که با نام‌های تجاری مختلف عرضه می‌شوند. از سال 2009، اینتل، انویدیا و AMD/ATI با داشتن سهم بازار به ترتیب 49.4٪، 27.8٪ و 20.6٪، رهبران بازار اولیه بودند. Matrox همچنین GPU تولید می کند. علاوه بر این، شرکت‌های چینی، از جمله Jingjia Micro، پردازنده‌های گرافیکی را عمدتاً برای بازار داخلی خود تولید کرده‌اند، اگرچه حجم فروش جهانی آن‌ها به‌طور قابل‌توجهی کمتر از پیشروان بازار است.

قابلیت های محاسباتی

عملکرد یک کارت گرافیک در رندر بلادرنگ تحت تأثیر چندین فاکتور معماری، از جمله ابعاد مسیرهای اتصال در ساخت دستگاه نیمه هادی، فرکانس سیگنال ساعت، و کمیت و ظرفیت حافظه پنهان یکپارچه است. عملکرد علاوه بر این با تعداد چند پردازنده‌های جریانی (SM) در GPUهای انویدیا، واحدهای محاسباتی (CU) در پردازنده‌های گرافیکی AMD یا هسته‌های Xe در پردازنده‌های گرافیکی مبتنی بر Xe اینتل تعیین می‌شود. این واحدها هسته‌های پردازشگر روی سیلیکون را در تراشه GPU نشان می‌دهند که محاسبات اولیه را انجام می‌دهند و اغلب به موازات سایر SM یا CU کار می‌کنند. عملکرد GPU به طور معمول در عملیات ممیز شناور در ثانیه (FLOPS) تعیین می شود. پردازنده‌های گرافیکی توسعه‌یافته در طول دهه‌های 2010 و 2020 معمولاً به سطوح عملکرد اندازه‌گیری شده در ترافلاپس (TFLOPS) دست می‌یابند. توجه به این نکته مهم است که این معیار عملکرد تخمینی را ارائه می دهد، زیرا عناصر مختلف دیگر می توانند بر نرخ نمایش واقعی تأثیر بگذارند.

واسط های برنامه نویسی برنامه گرافیکی دو بعدی

GPUهای قدیمی اغلب از یک یا چند رابط برنامه نویسی کاربردی گرافیکی دوبعدی (API) برای شتاب دو بعدی، از جمله GDI و DirectDraw پشتیبانی می کنند.

پیکربندی‌های GPU

اصطلاحات

در طول دهه 1970، نام اختصاری "GPU" در ابتدا یک واحد پردازنده گرافیکی را نشان می‌داد، که مشخصه یک جزء پردازشی قابل برنامه‌ریزی است که به طور مستقل از واحد پردازش مرکزی (CPU) کار می‌کند و به دستکاری و خروجی گرافیک اختصاص دارد. در سال 1994، سونی از واژه (به معنای واحد پردازش گرافیکی) برای اشاره به پردازنده گرافیکی سونی طراحی شده توسط توشیبا در کنسول پلی استیشن استفاده کرد. متعاقباً انویدیا این اصطلاح را در سال 1999 رایج کرد و GeForce 256 خود را به عنوان "اولین GPU در جهان" به بازار عرضه کرد که به عنوان یک "پردازنده تک تراشه با تبدیل یکپارچه، نورپردازی، راه اندازی/بریده شدن مثلث و موتورهای رندر" ارائه شد. در پاسخ، ATI Technologies رقیب، نام "واحد پردازش بصری" (VPU) را پس از انتشار Radeon 9700 خود در سال 2002 معرفی کرد. اخیراً، AMD Alveo MA35D که در سال 2023 راه اندازی شد، دارای VPU های دوگانه است که هر کدام با استفاده از یک سیستم 5 نانومتری پردازشگر پردازشی 5 نانومتری ساخته شده اند.

تنظیمات: گرافیک اختصاصی (همچنین به عنوان گرافیک گسسته شناخته می شود) و گرافیک یکپارچه (که به طور متناوب به عنوان راه حل های گرافیکی مشترک، پردازنده های گرافیکی یکپارچه (IGP) یا معماری حافظه یکپارچه (UMA) شناخته می شود).

واحد پردازش گرافیک اختصاصی

واحدهای پردازش گرافیکی اختصاصی از حافظه دسترسی تصادفی (RAM) استفاده می‌کنند که به طور انحصاری به GPU اختصاص داده شده است، بنابراین به حافظه اصلی سیستم کامپیوتر بستگی ندارد. این رم تخصصی، مانند GDDR SDRAM، معمولاً برای تطبیق با حجم کاری متوالی پیش بینی شده کارت گرافیک انتخاب می شود. از لحاظ تاریخی، سیستم‌های مجهز به پردازنده‌های گرافیکی گسسته اختصاصی اغلب سیستم‌های "DIS" نامیده می‌شوند، برخلاف سیستم‌های UMA (معماری حافظه یکپارچه).

تکنولوژی هایی مانند Scan-Line Interleave توسط 3dfx، Scalable Link Interface (SLI) و NVLink توسط Nvidia، و CrossFire توسط AMD، چندین GPU را قادر می سازند تا تصاویر را به صورت همزمان برای یک نمایشگر ارائه دهند، در نتیجه ظرفیت محاسباتی اختصاص داده شده به پردازش گرافیکی را افزایش می دهند. با این وجود، شیوع این پیکربندی‌های چند GPU در حال کاهش است، در درجه اول به این دلیل که بیشتر بازی‌های معاصر به طور کامل از قابلیت‌های خود استفاده نمی‌کنند و هزینه‌های مرتبط برای اکثر مصرف‌کنندگان گران است. علیرغم کاهش پذیرش مصرف کننده، تنظیمات چند GPU در حوزه های تخصصی مانند ابررایانه (به عنوان مثال، Summit)، ایستگاه های کاری حرفه ای برای سرعت بخشیدن به پردازش ویدئو و رندر سه بعدی، تولید جلوه های بصری (VFX)، بارهای کاری واحد پردازش گرافیکی همه منظوره (GPGPU)، شبیه سازی های علمی (شبیه سازی هوش مصنوعی DIA)، و Xvi، یکپارچه باقی می مانند. ایستگاه‌های کاری و سرورها، پردازنده‌های گرافیکی تسلا، و پردازنده‌های گرافیکی Ponte Vecchio اینتل.

واحدهای پردازش گرافیک یکپارچه

واحدهای پردازش گرافیکی یکپارچه (IGPU)، که به‌عنوان گرافیک یکپارچه، راه‌حل‌های گرافیکی مشترک، پردازنده‌های گرافیکی یکپارچه (IGP)، یا معماری‌های حافظه یکپارچه (UMA) نیز شناخته می‌شوند، از بخشی از حافظه اصلی سیستم استفاده می‌کنند (RAM) حافظه گرافیکی این پردازنده‌های گرافیکی یکپارچه را می‌توان مستقیماً روی یک مادربرد، اغلب به‌عنوان جزئی از چیپ‌ست پل شمالی، جاسازی کرد، یا روی همان قالب مدار مجتمعی که واحد پردازش مرکزی (CPU) قرار دارد، قرار گرفت، که نمونه‌ای از واحدهای پردازش شتاب‌دهنده (APU) AMD و گرافیک Intel HD است. علاوه بر این، طراحی‌های خاص مادربرد به IGP‌های AMD امکان دسترسی به حافظه جانبی اختصاصی را می‌دهد، که یک بلوک حافظه متمایز و با کارایی بالا را تشکیل می‌دهد که منحصراً برای عملیات GPU اختصاص داده شده است. در اوایل سال 2007، سیستم‌های مجهز به گرافیک یکپارچه تقریباً 90 درصد از محموله‌های رایانه‌های شخصی را تشکیل می‌دادند. در حالی که پیاده سازی مقرون به صرفه تری را در مقایسه با راه حل های گرافیکی گسسته ارائه می دهند، معمولاً قابلیت های عملکرد کمتری را نشان می دهند. از لحاظ تاریخی، راه حل های گرافیکی یکپارچه برای بازی های سه بعدی یا برنامه های کاربردی فشرده نامناسب تلقی می شدند، اگرچه آنها به اندازه کافی از برنامه های کم فشارتر مانند Adobe Flash پشتیبانی می کردند. نمونه‌های گویا از این دوران شامل ارائه‌هایی از SiS و VIA در حدود سال 2004 است. با این وجود، پردازنده‌های گرافیکی یکپارچه معاصر، از جمله واحدهای پردازش شتاب‌دهنده AMD و انواع فناوری گرافیک اینتل (مانند HD، UHD، Iris، Iris Pro، Iris Plus، و Xe-LP دارای نیاز به نسخه‌های جدیدی هستند که نیاز به استفاده از آن دارند). حجم کاری گرافیک سه بعدی.

با توجه به ماهیت حافظه فشرده محاسبات GPU، واحدهای پردازش گرافیکی یکپارچه (IGP) اغلب با واحد پردازش مرکزی (CPU) برای دسترسی به RAM نسبتاً کندتر سیستم، به دلیل حداقل یا عدم وجود حافظه ویدئویی اختصاصی خود، درگیر هستند. در حالی که IGP ها معمولاً از حافظه سیستم با پهنای باند تقریباً 128 گیگابایت در ثانیه استفاده می کنند، یک کارت گرافیک مجزا می تواند به پهنای باند بیش از 1000 گیگابایت در ثانیه بین حافظه دسترسی تصادفی ویدیویی خود (VRAM) و هسته GPU دست یابد. چنین تفاوت‌هایی در پهنای باند گذرگاه حافظه می‌تواند به طور قابل توجهی عملکرد GPU را محدود کند، اگرچه پیاده‌سازی پیکربندی‌های حافظه چند کانالی می‌تواند تا حدی این محدودیت را کاهش دهد. از لحاظ تاریخی، چیپست‌های گرافیکی یکپارچه، قابلیت‌های تبدیل سخت‌افزار و نورپردازی را حذف می‌کردند. با این حال، تکرارهای مدرن اکنون این ویژگی‌ها را در خود جای داده‌اند.

در سیستم‌هایی که از معماری حافظه یکپارچه (UMA) استفاده می‌کنند، مانند پردازنده‌های امروزی AMD و اینتل با گرافیک یکپارچه، پردازنده‌های اپل و کنسول‌هایی مانند پلی‌استیشن 5 و سری ایکس‌باکس، واحد پردازش مرکزی (CPU) هسته‌های پردازشی مشترک (CPUG) دسترسی به واحد پردازشی pog و واحد پردازش مرکزی (CPUG) را دارند. حافظه با دسترسی تصادفی (RAM) و یک فضای آدرس حافظه یکپارچه.

استریم پردازش و پردازش جریانی (Greenphicsh-Purpose)
استفاده از واحد پردازش گرافیکی همه منظوره (GPGPU) به عنوان یک پردازشگر جریانی یا برداری سازگار، برای اجرای هسته های محاسباتی، به یک روش رایج تبدیل شده است. این روش به طور موثر قابلیت های محاسباتی قابل توجهی را که در خط لوله سایه زن شتاب دهنده های گرافیکی مدرن وجود دارد به منبعی همه کاره برای محاسبات همه منظوره تبدیل می کند. برای کاربردهای خاصی که نیاز به عملیات برداری گسترده دارند، این رویکرد می تواند بهبود عملکرد را چندین مرتبه بیشتر از آنچه با یک واحد پردازش مرکزی معمولی (CPU) قابل دستیابی است، ارائه دهد. هر دو AMD و Nvidia، طراحان پیشرو پردازنده‌های گرافیکی گسسته، به طور فعال این الگو را در طیف متنوعی از برنامه‌های کاربردی پیش می‌برند. قابل ذکر است که انویدیا و AMD با دانشگاه استنفورد برای توسعه یک کلاینت با شتاب GPU برای پروژه محاسباتی توزیع‌شده Folding@home که به شبیه‌سازی‌های تاشو پروتئین اختصاص دارد، همکاری کردند. تحت شرایط خاص، GPU می‌تواند محاسبات را تا چهل برابر سریع‌تر از CPUهایی که در گذشته برای این نوع برنامه‌ها به کار می‌رفتند، انجام دهد.
سیستم‌های محاسباتی با کارایی بالا با شتاب واحد پردازش گرافیکی در تسهیل مدل‌سازی محاسباتی در مقیاس بزرگ نقش اساسی دارند. در حال حاضر، سه تا از ده ابررایانه برتر دنیا از شتاب GPU برای دستیابی به قدرت محاسباتی خود استفاده می کنند.

از سال 2005، علاقه قابل توجهی به استفاده از قابلیت‌های محاسباتی GPUها برای محاسبات تکاملی عمومی، به‌ویژه برای تسریع ارزیابی تناسب اندام در برنامه‌نویسی ژنتیکی، پدیدار شد. متدولوژی های غالب شامل کامپایل برنامه های خطی یا درختی بر روی کامپیوتر میزبان و متعاقبا انتقال کد اجرایی به GPU برای اجرا می باشد. دستاوردهای عملکرد معمولاً با اجرای همزمان یک برنامه فعال واحد در چندین نمونه مشکل موازی، با بهره‌برداری از معماری تک دستورالعمل، داده‌های چندگانه (SIMD) GPU محقق می‌شود. علاوه بر این، شتاب قابل توجهی را می توان با کامپایل برنامه قبلی و در عوض انتقال مستقیم برنامه ها به GPU برای تفسیر به دست آورد.

GPU خارجی (eGPU)

یک GPU را می توان از طریق یک گذرگاه خارجی با یک نوت بوک وصل کرد و PCI Express استاندارد انحصاری استفاده شده برای این برنامه است. انواع پورت های موجود عبارتند از، اما نه محدود به، ExpressCard یا mPCIe (PCIe × 1، به ترتیب تا 5 یا 2.5 گیگابیت در ثانیه ارائه می دهد)، Thunderbolt 1، 2، یا 3 (PCIe ×4، ارائه حداکثر 10، 20، یا 40 گیگابیت سازگاری با USBTu، به ترتیب با Thunderbolt4) OCuLink. در دسترس بودن این پورت ها منوط به پیکربندی سیستم نوت بوک خاص است. محفظه‌های GPU خارجی به دلیل مصرف انرژی قابل توجه، به طور بالقوه صدها وات، پردازنده‌های گرافیکی با کارایی بالا، نیاز به یک واحد منبع تغذیه مستقل (PSU) دارند.

کارایی انرژی

فروش

محموله‌های GPU جهانی به 438.3 میلیون واحد در سال 2013 رسید که کاهش پیش‌بینی‌شده به 414.2 میلیون دستگاه برای سال 2014 خواهد بود.

سخت افزار

لیست واحدهای پردازش گرافیکی AMD
لیست واحدهای پردازش گرافیکی Nvidia
لیست واحدهای پردازش گرافیکی اینتل
فهرست واحدهای پردازش گرافیکی گسسته و یکپارچه
Intel GMA
لارابی
Nvidia PureVideo یک فناوری بیت‌استریم است که توسط انویدیا توسعه یافته است و در تراشه‌های گرافیکی آن ادغام شده است تا رمزگشایی ویدیو با سرعت سخت‌افزار را در GPUهایی که از DXVA استفاده می‌کنند، تسهیل کند.
SoC
UVD (رمزگشا ویدیوی یکپارچه) فناوری بیت‌استریم رمزگشایی ویدیوی ATI را نشان می‌دهد که برای فعال کردن رمزگشایی پردازنده گرافیکی با شتاب سخت‌افزاری از طریق DXVA طراحی شده است.

API

برنامه ها

خوشه GPU
Mathematica از پشتیبانی بومی برای اجرای GPU از طریق چارچوب‌های CUDA و OpenCL استفاده می‌کند.
مدلسازی مولکولی در GPU
Deeplearning4j یک چارچوب یادگیری عمیق منبع باز و توزیع شده است که به طور خاص برای محیط های جاوا طراحی شده است.

افراد

فهرست همنام‌های ریزمعماری GPU Nvidia

مراجع

منابع

پدی، جان (1 ژانویه 2023). تاریخچه GPU – تحولات جدید. Springer Nature. ISBN 978-3-03-114047-1. OCLC 1356877844.

واحد پردازش گرافیک (Graphics processing unit)