یک واحد پردازش گرافیکی (GPU) نشان دهنده یک مدار الکترونیکی تخصصی است که برای پردازش تصویر دیجیتال و تسریع گرافیک کامپیوتری مهندسی شده است. این واحدها یا بهعنوان اجزای مجزا روی کارتهای گرافیکی یا در مادربردها، تلفنهای همراه، رایانههای شخصی، ایستگاههای کاری و کنسولهای بازی تعبیه شدهاند. علاوه بر این، پردازندههای گرافیکی به طور فزایندهای در پردازش هوش مصنوعی (AI) استفاده میشوند و از قابلیتهای خود در شتاب جبر خطی استفاده میکنند، تکنیکی که برای پردازش گرافیکی نیز اساسی است.
در حالی که یک تعریف منحصر به فرد برای این واژه مبهم باقی میماند، و میتواند به طور کلی هر سیستم نمایش ویدیویی را در بر بگیرد، اما ظرفیت گرافیکی فشردهای داخلی را برای ما تعریف میکند. عملیات، مانند چرخش و مقیاس بندی تصاویر سه بعدی. اغلب، GPU ها از اجرای برنامه های سفارشی به نام shader نیز پشتیبانی می کنند. این عملکرد آنها را از کنترلکنندههای گرافیکی قبلی، بهویژه کنترلکنندههای نمایشگر ویدیویی، که فاقد قابلیتهای محاسباتی داخلی هستند، و blitters، که محدود به عملیات انتقال حافظه اساسی بودند، متمایز میکند. GPU مدرن در دهه 1990 تکامل یافت و در ابتدا توانایی رندر خطوط و متن مستقل از واحد پردازش مرکزی (CPU) و متعاقباً یکپارچهسازی قابلیتهای سه بعدی را داشت.
استقلال ذاتی توابع گرافیکی اجرای آنها را در موتورهای محاسباتی متمایز تسهیل میکند. پردازندههای گرافیکی معاصر صدها یا حتی هزاران واحد پردازشی را در خود جای دادهاند. این معماری موازی آنها را برای محاسبات غیر گرافیکی که شامل مشکلات موازی شرم آور است بسیار موثر می کند. ظرفیت پردازندههای گرافیکی برای اجرای محاسبات متعدد به سرعت باعث ادغام آنها در حوزههای مختلف، بهویژه هوش مصنوعی (AI) شده است، جایی که آنها عملکرد استثنایی در مدیریت وظایف محاسباتی فشرده و سختگیرانه از خود نشان میدهند. برنامههای غیر گرافیکی اضافی شامل آموزش شبکه عصبی و استخراج ارزهای دیجیتال است.
تاریخچه
دهه 1960
منشا سختافزار گرافیک سه بعدی اختصاصی را میتوان در پایانههای گرافیکی مانند Adage AGT-30 که در سال 1967 معرفی شد، که دارای پردازندههای ماتریس آنالوگ بود، ردیابی کرد. در سال 1969، Evans & ساترلند (E&S) از سیستم ترسیم خط-1 (LDS-1) پرده برداری کرد که به عنوان اولین سیستم تمام دیجیتالی با قابلیت ضرب ماتریس قابل توجه است. همزمان در سال 1969، IMLAC PDS-1، یک پایانه گرافیکی مقرون به صرفه، راه اندازی شد. این سیستم متعاقباً به عنوان یک پلتفرم اولیه برای بازیهای سهبعدی عمل کرد که نمونهای از آن عناوینی مانند Maze War بود.
دهه 1970
در قلمرو سختافزار حرفهای، سیستم PLATO IV در دانشگاه ایلینویز Urbana-Champaign در سال 1972 شروع به کار کرد. تقریباً از سال 1973 تا 1978، کاربران این سیستم چندین بازی سهبعدی وایرفریم چند نفره شبکهای را توسعه داده و رایج کردند. همچنین در سال 1972، سیستم "جعبه Watkins" E&S Continuous Tone 1 (CT1)، شامل یک E&S LDS-2 و یک سیستم تصویر سایه دار، در دانشگاه Case Western Reserve مستقر شد و اولین سایه زنی Gouraud در زمان واقعی را معرفی کرد. در سال 1975، یک تلاش مشترک بین Evans & شرکت کامپیوتری ساترلند و بخش گرافیک کامپیوتری دانشگاه یوتا، فریم بافر ویدئویی MOSFET پیشگام را تولید کردند که از رنگ و سایه صاف پشتیبانی می کرد. سیستم E&S Continuous Tone 3 (CT3) که در سال 1977 برای آموزش خلبانی از طریق شبیه سازی کامپیوتری به لوفت هانزا تحویل داده شد، نشان دهنده اولین سیستم گرافیکی با قابلیت نقشه برداری بافت در زمان واقعی بود. در اواخر دهه 1970، آیکناس سیستمهای گرافیکی با گرافیک 8 بیتی و 24 بیتی را در کنار شتاب سه بعدی تولید کرد.
از دهه 1970، بردهای سیستم آرکید مدارهای گرافیکی دو بعدی تخصصی را در خود جای دادهاند. در مراحل ابتدایی سختافزار بازیهای ویدیویی، هزینه بالای RAM برای بافرهای فریم ایجاب میکرد که تراشههای ویدیویی دادههای ترکیبی را در طول فرآیند اسکن نمایش بر روی مانیتور انجام دهند.
مدار شیفتر لوله اختصاصی، انیمیشن گرافیکهای فریمبافر CPU را برای بازیهای ویدیویی آرکید متعدد دهه 1970 که توسط Midway و Taito توسعه یافته بودند، تسهیل کرد، از جمله Gun Fight (1975)، Sea Wolf (1976)، و Space Invaders. در سال 1979، سیستم آرکید Namco Galaxian سختافزار گرافیکی تخصصی را ادغام کرد که از رنگهای RGB، اسپرایتهای چند رنگ و پسزمینههای نقشه کاشی پشتیبانی میکرد. سختافزار Galaxian در دوران طلایی بازیهای ویدیویی آرکید که توسط شرکتهای برجستهای مانند Namco، Centuri، Gremlin، Irem، Konami، Midway، Nichibutsu، Sega و Taito استفاده میشد، به طور گسترده مورد استفاده قرار گرفت.
در سال 1977، کنسول آتاری 2600 از یک تغییر دهنده ویدیو به نام آداپتور رابط تلویزیونی استفاده کرد. متعاقباً، کامپیوترهای 8 بیتی آتاری، که در سال 1979 معرفی شدند، ANTIC، یک پردازنده ویدئویی اختصاصی را در خود جای دادند. ANTIC یک "فهرست نمایش" را تفسیر کرد که نحوه نگاشت خطوط اسکن به حالت های بیت مپ یا کاراکتر خاص و مدیریت ذخیره سازی حافظه را تعریف می کرد، در نتیجه نیاز به یک بافر فریم پیوسته را حذف می کرد. علاوه بر این، این پردازنده اجرای 6502 زیرروال کد ماشین را در خطوط اسکن خاص با فعال کردن یک بیت تعیین شده در دستورالعمل لیست نمایش، فعال کرد. ANTIC همچنین پیمایش عمودی و افقی مستقل را تسهیل میکند که توسط واحد پردازش مرکزی تخلیه میشود.
دهه 1980
دهه 1980 با پیشرفت های قابل توجهی در سخت افزار گرافیک سه بعدی حرفه ای مشخص شد. یکی از پیشرفتهای بسیار مهم، ایجاد موتور هندسه در سال 1981 بود، یک پردازنده برداری بردار یکپارچهسازی در مقیاس بسیار بزرگ (VLSI)، مدار مجتمع ویژه برنامه (ASIC)، که توسط جیم کلارک و مارک هانا در دانشگاه استنفورد طراحی شد. این پردازنده به عنوان پیشروی برای هسته های تانسوری معاصر و پردازنده های مشابه مورد استفاده در گرافیک و برنامه های هوش مصنوعی شناخته می شود. موتور Geometry متعاقباً برای مدت طولانی در ایستگاه های کاری Silicon Graphics ادغام شد. محصول افتتاحیه Silicon Graphics، ترمینال IRIS 1000، که در نوامبر 1983 عرضه شد، دارای گرافیک سه بعدی با شتاب سخت افزاری بود که توسط Geometry Engine طراحی شده بود. این پردازنده نوآورانه توانایی پردازش تقریباً 6 میلیون عملیات در ثانیه را نشان داد.
NEC μPD7220 اجرای افتتاحیه یک پردازنده نمایشگر گرافیکی رایانه شخصی را به عنوان یک تراشه مدار مجتمع یکپارچه مقیاس بزرگ (LSI) نشان داد. این نوآوری توسعه کارتهای گرافیکی مقرونبهصرفه و با کارایی بالا را تسهیل کرد که نمونهای از آنها از فناوری بصری Number Nine بود. تا اواسط دهه 1980 به عنوان شناخته شده ترین واحد پردازش گرافیکی (GPU) شهرت یافت. به عنوان اولین پردازشگر نمایشگر گرافیکی کاملاً یکپارچه با مقیاس بسیار بزرگ (VLSI) فلز اکسید-نیمه هادی (NMOS) برای رایانه های شخصی، رزولوشن تا 1024×1024 را پشتیبانی کرد و زمینه را برای بازار گرافیک رایانه شخصی ایجاد کرد. μPD7220 در کارتهای گرافیکی متعددی گنجانده شد و متعاقباً مجوز طراحیهای سازگار دریافت کرد، از جمله Intel 82720، که نشاندهنده ورود اولیه اینتل به واحدهای پردازش گرافیکی بود. همزمان، بازیهای آرکید ویلیامز الکترونیک 1982، Robotron: 2084، Joust، Sinistar و Bubbles، هر کدام دارای تراشههای blitter سفارشی بودند که برای دستکاری نقشههای بیتی 16 رنگی، ARTC4>
طراحی شدهاند. HD63484، که اولین پردازنده گرافیکی مهم مکمل فلز-اکسید-نیمه هادی (CMOS) برای رایانه های شخصی شد. ARTC میتوانست هنگام کار در حالت تک رنگ، وضوح تصویر تا 4K را ارائه دهد. در اواخر دهه 1980 به طور گسترده در کارت های گرافیک و پایانه های مختلف مورد استفاده قرار گرفت.
آمیگا که در سال 1985 راه اندازی شد، با یک تراشه گرافیکی اختصاصی به نام Agnus معرفی شد. این تراشه دارای یک blitter بود که دستکاری بیت مپ، ترسیم خط و عملیات پر کردن ناحیه را تسهیل می کرد. علاوه بر این، آگنوس یک پردازنده کمکی مجهز به مجموعه دستورالعمل ساده خود را ارائه کرد. این پردازنده کمکی قادر به دستکاری همزمان ثبتهای سختافزار گرافیکی با پرتو ویدئو بود، و قابلیتهایی مانند سوئیچهای پالت در هر اسکن، مالتیپلکس کردن اسپرایت و پنجرهسازی سختافزار را ممکن میکرد، یا میتوانست مستقیماً تابش را کنترل کند.
همچنین در سال 1985، IBM کنترلگر گرافیکی حرفه ای را معرفی کرد که یک کارت گرافیک سه بعدی پایه بود. وضوح تصویر 640 × 480 را با گرافیک 256 رنگ ارائه میکرد و از یک CPU اختصاصی برای ارائه خودکار گرافیک از سیستم اصلی استفاده میکرد. این کنترلکننده بهعنوان پایهای معماری برای کارتهای تولید شده توسط تولیدکنندگان مختلف، از جمله Matrox، عمل میکرد و سیگنالهای RGB آنالوگ آن مستقیماً بر توسعه استاندارد ویدئویی VGA تأثیر گذاشت.
در سال 1986، Texas Instruments از TMS34010 رونمایی کرد که خود را به عنوان اولین پردازنده گرافیکی کاملاً قابل برنامهریزی متمایز کرد. این پردازنده توانایی اجرای کدهای همه منظوره را داشت و در عین حال دارای یک مجموعه دستورالعمل تخصصی گرافیک محور بود. از سال 1990 تا 1992، این تراشه متعاقباً هسته کارتهای شتاب دهنده ویندوز معماری گرافیک تگزاس اینسترومنتز ("TIGA") را تشکیل داد.
متعاقباً، در سال 1987، IBM سیستم گرافیکی 8514 را معرفی کرد. این سیستم خود را بهعنوان یکی از کارتهای ویدئویی اولیه برای رایانههای شخصی IBM برای پیادهسازی اولیههای دوبعدی با عملکرد ثابت بهطور مستقیم در سختافزار الکترونیکی متمایز کرد. همچنین در سال 1987، کامپیوتر X68000 شارپ یک چیپست گرافیکی سفارشی را در خود جای داد که یک پالت 65536 رنگ ارائه میکرد و شتاب سختافزاری برای اسپرایتها، اسکرول و چندین زمین بازی فراهم میکرد. این دستگاه به طور مشخص به عنوان پلت فرم توسعه برای برد آرکید سیستم CP Capcom عمل می کرد. دو سال بعد، در سال 1989، کامپیوتر FM Towns فوجیتسو از یک پالت 16777216 رنگ پشتیبانی کرد.
در سال 1987، IBM سیستم نمایشگر آرایه گرافیکی ویدئویی (VGA) خود را معرفی کرد که از حداکثر وضوح 640 × 480 پیکسل پشتیبانی می کرد. برخلاف 8514/A، VGA فاقد قابلیت های شتاب سخت افزاری بود. در نوامبر 1988، NEC Home Electronics انجمن استانداردهای الکترونیک ویدئویی (VESA) را برای توسعه و ترویج Super VGA (SVGA) به عنوان یک استاندارد نمایشگر کامپیوتری جانشین VGA تأسیس کرد. وضوح صفحه نمایش Super VGA تا رسیدن به 800 × 600 پیکسل پشتیبانی میکند که نشاندهنده افزایش 56 درصدی وضوح است.
در طول سال 1988، SGI سیستمهای IRIS1 را مجهز به سیستمهای Engine20 و IRIS Engine20 و 1graph معرفی کرد. متعاقباً برد الحاقی IrisVision را نیز بر اساس موتور هندسه، برای سیستمهای گذرگاه MicroChannel IBM (RS/6000) راهاندازی کرد.
همزمان در سال 1988، Namco System 21 و Taito Air System معرفی شدند که دارای تابلوهای 3 بعدی در دستگاههای چند ضلعی اختصاصی >p هستند.
دهه 1990
دهه 1990 شاهد پیشرفت قابل توجهی در سخت افزارهای گرافیکی سه بعدی ایستگاه کاری حرفه ای از Sun Microsystems، SGI و سایر سازندگان بود. معرفی OpenGL توسط SGI در سال 1992 پایه و اساس رابط های برنامه نویسی سه بعدی استاندارد شده و مستقل از سخت افزار را ایجاد کرد. با این وجود، در اواسط تا اواخر دهه 1990، سخت افزارهای حرفه ای به تدریج تحت الشعاع محصولات مصرفی قرار گرفتند. این پیشنهادات مصرفکننده عملکرد قابل مقایسه یا برتری را، بهویژه در مورد نقشهبرداری بافت، با هزینه کمتر و در پلتفرمهایی که برای کاربران نهایی قابل دسترستر بود، ارائه میکردند.
در سال 1991، S3 Graphics S3 86C911 را معرفی کرد که توسط طراحان آن پس از Porsche 911 نامگذاری شد تا نشاندهنده بهبود عملکرد مورد انتظار آن باشد. 86C911 الهام گرفته از تقلیدهای متعدد. تا سال 1995، تمام سازندگان برجسته تراشههای گرافیکی رایانه شخصی، قابلیتهای شتاب دوبعدی را در محصولات خود ادغام کردند. شتابدهندههای ویندوز با کارکرد ثابت متعاقباً از پردازندههای گرافیکی پرهزینه همه منظوره در محیطهای ویندوز بهتر عمل کردند که منجر به منسوخ شدن دومی در بازار رایانههای شخصی شد.
در اوایل تا اواسط دهه 1990، تکثیر گرافیکهای سهبعدی بلادرنگ در بازیهای آرکید، رایانه و کنسول باعث افزایش تقاضای مصرفکنندگان برای راهحلهای گرافیکی سهبعدی با شتاب سختافزاری شد. نمونههای پیشگامی از سختافزار گرافیک سهبعدی در بازار انبوه در بردهای سیستم آرکید، از جمله Sega Model 1، Namco System 22، و Sega Model 2، و همچنین در کنسولهای بازی ویدیویی نسل پنجم مانند Saturn، PlayStation، و Nintendo 64 ظاهر شد. Magic Edge Hornet Simulator، که در سال 1993 معرفی شد، سالها قبل از ادغام آنها در کارتهای گرافیک مصرفکننده، قابلیتهای T&L (تبدیل، برش و نورپردازی) را با شتاب سختافزاری ارائه میکرد. یک نوآوری اولیه اضافی، تراشه Super FX بود، یک پردازنده گرافیکی مبتنی بر RISC که در کارتریج های بازی SNES تعبیه شده بود، که به طور برجسته در عناوینی مانند Doom و Star Fox استفاده می شد. سیستمهای خاصی از پردازندههای سیگنال دیجیتال (DSP) برای تسریع تحولات استفاده میکنند. فوجیتسو، یکی از مشارکتکنندگان در سیستم آرکید سگا مدل 2، در سال 1995 تلاشهایی را برای ادغام T&L در راهحل یکپارچه ادغام مقیاس بزرگ (LSI) برای رایانههای شخصی آغاز کرد. این تلاش در Fujitsu Pinolite، اولین پردازنده هندسه سه بعدی برای رایانه های شخصی، که در سال 1997 رونمایی شد، به اوج خود رسید. Reality Coprocessor Nintendo 64، که در سال 1996 راه اندازی شد، نشان دهنده افتتاحیه سخت افزار T&L GPU برای کنسول های بازی ویدیویی خانگی بود. متعاقباً، در سال 1997، میتسوبیشی 3Dpro/2MP را معرفی کرد، یک GPU که قابلیت تبدیل و روشنایی را برای ایستگاه های کاری و دسکتاپ های ویندوز NT ارائه می دهد. ATi این فناوری را در کارت گرافیک FireGL 4000 خود، که در سال 1997 نیز منتشر شد، وارد کرد.
نام اختصاری "GPU" توسط سونی ابداع شد، به طور خاص به پردازنده گرافیکی 32 بیتی سونی (مهندسی توشیبا) ادغام شده در کنسول بازی ویدیویی پلی استیشن، که در سال 1994 معرفی شد.
دهه 2000
در اکتبر 2002، راه اندازی ATI Radeon 9700 (همچنین با نام R300) که به عنوان شتاب دهنده افتتاحیه Direct3D 9.0 در جهان شناخته شد، سایه زن های پیکسل و رأس را قادر به اجرای محاسبات ممیز شناور تکراری و گسترده کرد. این سایهزنها به سرعت به انعطافپذیری CPUها نزدیک شدند و در عین حال سرعت بیشتری را برای پردازش آرایه تصویر ارائه میکردند. سایهزنی پیکسلی اغلب برای نگاشت برآمدگی استفاده میشود، تکنیکی که از بافت برای رندر کردن اجسام با ظاهرهای متنوع، مانند سطوح براق، کسلکننده، ناهموار، گرد یا اکسترود شده استفاده میکند.
با معرفی سری Nvidia GeForce 8 و واحدهای پردازش جریان عمومی جدید، واحدهای پردازش گرافیکی (GPU) به دستگاههای محاسباتی تعمیمیافتهتر تبدیل شدند. GPUهای موازی به تدریج واحدهای پردازش مرکزی (CPU) را در وظایف محاسباتی به چالش کشیده اند و یک حوزه تحقیقاتی تخصصی به نام محاسبات GPU یا GPGPU، مخفف محاسبات با هدف عمومی در GPU را تقویت کرده اند. این زمینه کاربردهای متنوعی از جمله یادگیری ماشینی، اکتشاف نفت، پردازش تصویر علمی، جبر خطی، آمار، بازسازی سه بعدی و قیمت گذاری گزینه های سهام را به همراه داشته است. GPGPU ها به عنوان پیشینیان پایه ای برای سایه زن های محاسباتی معاصر (مانند CUDA، OpenCL، DirectCompute) عمل کردند، در ابتدا از سخت افزار به شیوه ای غیر متعارف با تفسیر داده های الگوریتمی به عنوان نقشه های بافت و اجرای الگوریتم ها از طریق رندر مثلث یا چهارگوش با یک پیکسل مناسب استفاده می کردند. این رویکرد ذاتاً هزینه های عملیاتی را معرفی کرد، زیرا اجزایی مانند مبدل اسکن به طور غیرضروری درگیر می شدند، و دستکاری های مثلثی به جز برای تنها هدف فراخوانی سایه زن پیکسل بی ربط بودند.
پلتفرم CUDA توسط انویدیا، که در سال 2007 راه اندازی شد، نشان دهنده اولین برنامه به طور گسترده برای برنامه نویسی برنامه نویسی بود. برعکس، OpenCL، یک استاندارد باز ایجاد شده توسط گروه Khronos، توسعه کدهای سازگار با GPU و CPU را تسهیل میکند و قابلیت حمل بین پلتفرم را در اولویت قرار میدهد. پیاده سازی های OpenCL از بازیگران اصلی صنعت، از جمله Intel، AMD، Nvidia و ARM پشتیبانی می شوند. گزارش سال 2011 توسط Evans Data نشان داد که OpenCL به عنوان دومین ابزار رایج در محاسبات با عملکرد بالا (HPC) ظاهر شده است.
2010
در سال 2010، انویدیا با آئودی همکاری کرد تا پردازندههای گرافیکی Tegra را در داشبورد خودرو ادغام کند و بدین ترتیب عملکرد سیستمهای ناوبری و سرگرمی خودرو را افزایش دهد. به طور همزمان، پیشرفت در فناوری GPU در بخش خودرو کمک قابل توجهی به پیشرفت قابلیت های خودران کرد. AMD کارتهای گرافیک سری Radeon HD 6000 خود را در سال 2010 معرفی کرد و به دنبال آن پردازندههای گرافیکی مجزای سری 6000M برای پلتفرمهای موبایل در سال 2011 عرضه شد. ویژگی های قابل توجه ریزمعماری پردازنده گرافیکی Kepler شامل GPU Boost، فناوری طراحی شده برای تنظیم پویا سرعت ساعت کارت گرافیک بر اساس مصرف انرژی آن، و NVENC، یک فناوری اختصاصی شتاب رمزگذاری ویدئو است.
در سال 2013، کنسول های پلی استیشن 4 و ایکس باکس وان منتشر شدند که هر دو از کنسول های AMD8 و AMD7 5 استفاده می کردند. 7790 معماری. سری پردازندههای گرافیکی Kepler انویدیا توسط خط Maxwell که از فرآیند تولید یکسانی استفاده میکردند، جایگزین شد. تراشههای 28 نانومتری انویدیا توسط TSMC در تایوان ساخته شدهاند و از فرآیند 28 نانومتری استفاده میکنند که در مقایسه با فناوری قبلی 40 نانومتری، عملکرد 20 درصدی را در کنار کاهش مصرف انرژی به همراه داشت. هدستهای واقعیت مجازی، پس از عرضه اولیه، نیاز به مشخصات سیستم قابلتوجهی داشتند و سازندگان پردازندههای گرافیکی مانند GTX 970 یا R9 290X یا مدلهای برتر را توصیه میکردند. کارتهای گرافیکی مبتنی بر ریزمعماری پاسکال در سال 2016 معرفی شدند که شامل سری GeForce 10 است. این کارتها با استفاده از فرآیند ساخت 16 نانومتری تولید شدهاند که نشاندهنده پیشرفت قابلتوجهی نسبت به ریزمعماریهای قبلی است.
در سال 2018، انویدیا پردازندههای گرافیکی سری RTX 20 را معرفی کرد که هستههای اختصاصی ردیابی پرتو را یکپارچه میکردند و قابلیتهای ردیابی پرتو در زمان واقعی را در سختافزار درجه مصرفکننده امکانپذیر میکردند. همزمان، پردازندههای گرافیکی Polaris 11 و Polaris 10 AMD با استفاده از فرآیند 14 نانومتری تولید شدند که منجر به بهبود قابلتوجهی در معیار عملکرد بر وات کارتهای ویدئویی AMD شد. AMD در ادامه سری گرافیکهای Vega را راهاندازی کرد و بازار گرانقیمت را به عنوان رقیب مستقیم کارتهای پاسکال رده بالای انویدیا هدف قرار داد و به ویژه دارای حافظه باند پهنای باند 2 (HBM2)، شبیه به Titan V.
در سال 2019، AMD RDNA، جانشین مجموعه microarch (GraphicsChone و ساختار بعدی) خود را معرفی کرد. سری کارتهای گرافیک Radeon RX 5000 اولین محصولاتی هستند که از آن استفاده میکنند. متعاقباً این شرکت اعلام کرد که تکرار بعدی ریزمعماری RDNA یک "بازسازی" افزایشی را تشکیل خواهد داد. AMD بعداً از سری Radeon RX 6000 پرده برداری کرد که معماری گرافیکی RDNA 2 را در خود جای داده بود و از ردیابی پرتو با شتاب سخت افزاری پشتیبانی می کرد. این سری محصول که در اواخر سال 2020 عرضه شد، شامل RX 6800، RX 6800 XT و RX 6900 XT بود. RX 6700 XT، بر اساس معماری Navi 22، در اوایل سال 2021 عرضه شد.
پلیاستیشن 5، ایکسباکس سری ایکس و ایکسباکس سری اس، که همگی در سال 2020 منتشر شدند، پردازندههای گرافیکی مبتنی بر ریزمعماری RDNA 2 را یکپارچه میکنند، و دارای تنظیمات و پیکربندیهای افزایشی در سیستمهای GPU و تغییرات جزئی PU هستند. اجرا.
2020
در طول دهه 2020، واحدهای پردازش گرافیکی (GPU) شاهد پذیرش فزایندهای برای محاسبات مربوط به مشکلات بسیار موازیپذیر، بهویژه آموزش شبکههای عصبی بر روی مجموعه دادههای گسترده ضروری برای مدلهای زبان بزرگ هوش مصنوعی بودهاند. اکثر پردازندههای گرافیکی معاصر دارای هستههای پردازشی تخصصی هستند که برای یادگیری عمیق طراحی شدهاند، که عملکرد FLOPS را از طریق عملیات ضرب و تقسیم ماتریس 4×4 به طور قابلتوجهی افزایش میدهند. پیادهسازیهای اولیه، نمونهای از ریزمعماری Volta انویدیا، که در سال 2017 معرفی شد، نشان داد که سطوح عملکردی به 128 TFLOPS در برنامههای خاص میرسد.
متعاقبا، هستههای شتاب هوش مصنوعی به یک ویژگی رایج در ریزمعماریهای مصرفکننده و ایستگاههای کاری با ریزمعماریهای N210's، ریزمعماری N210', commens، تبدیل شدند. جایی که آنها به عنوان هسته های Tensor تعیین شدند. این هستهها که در ابتدا برای Deep Learning Super Sampling (DLSS) به منظور افزایش عملکرد بازی و بهبود وفاداری تصویر مستقر شدند، از آن زمان در نرمافزار Broadcast Nvidia ادغام شدهاند و قابلیتهای مختلف مبتنی بر هوش مصنوعی مانند فیلتر صدا و کاهش نویز ویدیو را ممکن میسازند.
AMD متعاقباً هستههای مشابه "Matrix" خود را در معماری RDNA 3 خود برای محصولات مصرفی ادغام کرد، در حالی که اینتل هستههای معادل "XMX" خود را در تمام پردازندههای گرافیکی Arc، با ریزمعماری Alchemist ترکیب کرد.
سازندگان GPU
شرکتهای متعددی پردازندههای گرافیکی تولید کردهاند که با نامهای تجاری مختلف عرضه میشوند. از سال 2009، اینتل، انویدیا و AMD/ATI با داشتن سهم بازار به ترتیب 49.4٪، 27.8٪ و 20.6٪، رهبران بازار اولیه بودند. Matrox همچنین GPU تولید می کند. علاوه بر این، شرکتهای چینی، از جمله Jingjia Micro، پردازندههای گرافیکی را عمدتاً برای بازار داخلی خود تولید کردهاند، اگرچه حجم فروش جهانی آنها بهطور قابلتوجهی کمتر از پیشروان بازار است.
قابلیت های محاسباتی
عملکرد یک کارت گرافیک در رندر بلادرنگ تحت تأثیر چندین فاکتور معماری، از جمله ابعاد مسیرهای اتصال در ساخت دستگاه نیمه هادی، فرکانس سیگنال ساعت، و کمیت و ظرفیت حافظه پنهان یکپارچه است. عملکرد علاوه بر این با تعداد چند پردازندههای جریانی (SM) در GPUهای انویدیا، واحدهای محاسباتی (CU) در پردازندههای گرافیکی AMD یا هستههای Xe در پردازندههای گرافیکی مبتنی بر Xe اینتل تعیین میشود. این واحدها هستههای پردازشگر روی سیلیکون را در تراشه GPU نشان میدهند که محاسبات اولیه را انجام میدهند و اغلب به موازات سایر SM یا CU کار میکنند. عملکرد GPU به طور معمول در عملیات ممیز شناور در ثانیه (FLOPS) تعیین می شود. پردازندههای گرافیکی توسعهیافته در طول دهههای 2010 و 2020 معمولاً به سطوح عملکرد اندازهگیری شده در ترافلاپس (TFLOPS) دست مییابند. توجه به این نکته مهم است که این معیار عملکرد تخمینی را ارائه می دهد، زیرا عناصر مختلف دیگر می توانند بر نرخ نمایش واقعی تأثیر بگذارند.
واسط های برنامه نویسی برنامه گرافیکی دو بعدی
GPUهای قدیمی اغلب از یک یا چند رابط برنامه نویسی کاربردی گرافیکی دوبعدی (API) برای شتاب دو بعدی، از جمله GDI و DirectDraw پشتیبانی می کنند.
پیکربندیهای GPU
اصطلاحات
در طول دهه 1970، نام اختصاری "GPU" در ابتدا یک واحد پردازنده گرافیکی را نشان میداد، که مشخصه یک جزء پردازشی قابل برنامهریزی است که به طور مستقل از واحد پردازش مرکزی (CPU) کار میکند و به دستکاری و خروجی گرافیک اختصاص دارد. در سال 1994، سونی از واژه (به معنای واحد پردازش گرافیکی) برای اشاره به پردازنده گرافیکی سونی طراحی شده توسط توشیبا در کنسول پلی استیشن استفاده کرد. متعاقباً انویدیا این اصطلاح را در سال 1999 رایج کرد و GeForce 256 خود را به عنوان "اولین GPU در جهان" به بازار عرضه کرد که به عنوان یک "پردازنده تک تراشه با تبدیل یکپارچه، نورپردازی، راه اندازی/بریده شدن مثلث و موتورهای رندر" ارائه شد. در پاسخ، ATI Technologies رقیب، نام "واحد پردازش بصری" (VPU) را پس از انتشار Radeon 9700 خود در سال 2002 معرفی کرد. اخیراً، AMD Alveo MA35D که در سال 2023 راه اندازی شد، دارای VPU های دوگانه است که هر کدام با استفاده از یک سیستم 5 نانومتری پردازشگر پردازشی 5 نانومتری ساخته شده اند.
تنظیمات: گرافیک اختصاصی (همچنین به عنوان گرافیک گسسته شناخته می شود) و گرافیک یکپارچه (که به طور متناوب به عنوان راه حل های گرافیکی مشترک، پردازنده های گرافیکی یکپارچه (IGP) یا معماری حافظه یکپارچه (UMA) شناخته می شود).
واحد پردازش گرافیک اختصاصی
واحدهای پردازش گرافیکی اختصاصی از حافظه دسترسی تصادفی (RAM) استفاده میکنند که به طور انحصاری به GPU اختصاص داده شده است، بنابراین به حافظه اصلی سیستم کامپیوتر بستگی ندارد. این رم تخصصی، مانند GDDR SDRAM، معمولاً برای تطبیق با حجم کاری متوالی پیش بینی شده کارت گرافیک انتخاب می شود. از لحاظ تاریخی، سیستمهای مجهز به پردازندههای گرافیکی گسسته اختصاصی اغلب سیستمهای "DIS" نامیده میشوند، برخلاف سیستمهای UMA (معماری حافظه یکپارچه).
تکنولوژی هایی مانند Scan-Line Interleave توسط 3dfx، Scalable Link Interface (SLI) و NVLink توسط Nvidia، و CrossFire توسط AMD، چندین GPU را قادر می سازند تا تصاویر را به صورت همزمان برای یک نمایشگر ارائه دهند، در نتیجه ظرفیت محاسباتی اختصاص داده شده به پردازش گرافیکی را افزایش می دهند. با این وجود، شیوع این پیکربندیهای چند GPU در حال کاهش است، در درجه اول به این دلیل که بیشتر بازیهای معاصر به طور کامل از قابلیتهای خود استفاده نمیکنند و هزینههای مرتبط برای اکثر مصرفکنندگان گران است. علیرغم کاهش پذیرش مصرف کننده، تنظیمات چند GPU در حوزه های تخصصی مانند ابررایانه (به عنوان مثال، Summit)، ایستگاه های کاری حرفه ای برای سرعت بخشیدن به پردازش ویدئو و رندر سه بعدی، تولید جلوه های بصری (VFX)، بارهای کاری واحد پردازش گرافیکی همه منظوره (GPGPU)، شبیه سازی های علمی (شبیه سازی هوش مصنوعی DIA)، و Xvi، یکپارچه باقی می مانند. ایستگاههای کاری و سرورها، پردازندههای گرافیکی تسلا، و پردازندههای گرافیکی Ponte Vecchio اینتل.
واحدهای پردازش گرافیک یکپارچه
واحدهای پردازش گرافیکی یکپارچه (IGPU)، که بهعنوان گرافیک یکپارچه، راهحلهای گرافیکی مشترک، پردازندههای گرافیکی یکپارچه (IGP)، یا معماریهای حافظه یکپارچه (UMA) نیز شناخته میشوند، از بخشی از حافظه اصلی سیستم استفاده میکنند (RAM) حافظه گرافیکی این پردازندههای گرافیکی یکپارچه را میتوان مستقیماً روی یک مادربرد، اغلب بهعنوان جزئی از چیپست پل شمالی، جاسازی کرد، یا روی همان قالب مدار مجتمعی که واحد پردازش مرکزی (CPU) قرار دارد، قرار گرفت، که نمونهای از واحدهای پردازش شتابدهنده (APU) AMD و گرافیک Intel HD است. علاوه بر این، طراحیهای خاص مادربرد به IGPهای AMD امکان دسترسی به حافظه جانبی اختصاصی را میدهد، که یک بلوک حافظه متمایز و با کارایی بالا را تشکیل میدهد که منحصراً برای عملیات GPU اختصاص داده شده است. در اوایل سال 2007، سیستمهای مجهز به گرافیک یکپارچه تقریباً 90 درصد از محمولههای رایانههای شخصی را تشکیل میدادند. در حالی که پیاده سازی مقرون به صرفه تری را در مقایسه با راه حل های گرافیکی گسسته ارائه می دهند، معمولاً قابلیت های عملکرد کمتری را نشان می دهند. از لحاظ تاریخی، راه حل های گرافیکی یکپارچه برای بازی های سه بعدی یا برنامه های کاربردی فشرده نامناسب تلقی می شدند، اگرچه آنها به اندازه کافی از برنامه های کم فشارتر مانند Adobe Flash پشتیبانی می کردند. نمونههای گویا از این دوران شامل ارائههایی از SiS و VIA در حدود سال 2004 است. با این وجود، پردازندههای گرافیکی یکپارچه معاصر، از جمله واحدهای پردازش شتابدهنده AMD و انواع فناوری گرافیک اینتل (مانند HD، UHD، Iris، Iris Pro، Iris Plus، و Xe-LP دارای نیاز به نسخههای جدیدی هستند که نیاز به استفاده از آن دارند). حجم کاری گرافیک سه بعدی.
با توجه به ماهیت حافظه فشرده محاسبات GPU، واحدهای پردازش گرافیکی یکپارچه (IGP) اغلب با واحد پردازش مرکزی (CPU) برای دسترسی به RAM نسبتاً کندتر سیستم، به دلیل حداقل یا عدم وجود حافظه ویدئویی اختصاصی خود، درگیر هستند. در حالی که IGP ها معمولاً از حافظه سیستم با پهنای باند تقریباً 128 گیگابایت در ثانیه استفاده می کنند، یک کارت گرافیک مجزا می تواند به پهنای باند بیش از 1000 گیگابایت در ثانیه بین حافظه دسترسی تصادفی ویدیویی خود (VRAM) و هسته GPU دست یابد. چنین تفاوتهایی در پهنای باند گذرگاه حافظه میتواند به طور قابل توجهی عملکرد GPU را محدود کند، اگرچه پیادهسازی پیکربندیهای حافظه چند کانالی میتواند تا حدی این محدودیت را کاهش دهد. از لحاظ تاریخی، چیپستهای گرافیکی یکپارچه، قابلیتهای تبدیل سختافزار و نورپردازی را حذف میکردند. با این حال، تکرارهای مدرن اکنون این ویژگیها را در خود جای دادهاند.
در سیستمهایی که از معماری حافظه یکپارچه (UMA) استفاده میکنند، مانند پردازندههای امروزی AMD و اینتل با گرافیک یکپارچه، پردازندههای اپل و کنسولهایی مانند پلیاستیشن 5 و سری ایکسباکس، واحد پردازش مرکزی (CPU) هستههای پردازشی مشترک (CPUG) دسترسی به واحد پردازشی pog و واحد پردازش مرکزی (CPUG) را دارند. حافظه با دسترسی تصادفی (RAM) و یک فضای آدرس حافظه یکپارچه.
استریم پردازش و پردازش جریانی (Greenphicsh-Purpose)
استفاده از واحد پردازش گرافیکی همه منظوره (GPGPU) به عنوان یک پردازشگر جریانی یا برداری سازگار، برای اجرای هسته های محاسباتی، به یک روش رایج تبدیل شده است. این روش به طور موثر قابلیت های محاسباتی قابل توجهی را که در خط لوله سایه زن شتاب دهنده های گرافیکی مدرن وجود دارد به منبعی همه کاره برای محاسبات همه منظوره تبدیل می کند. برای کاربردهای خاصی که نیاز به عملیات برداری گسترده دارند، این رویکرد می تواند بهبود عملکرد را چندین مرتبه بیشتر از آنچه با یک واحد پردازش مرکزی معمولی (CPU) قابل دستیابی است، ارائه دهد. هر دو AMD و Nvidia، طراحان پیشرو پردازندههای گرافیکی گسسته، به طور فعال این الگو را در طیف متنوعی از برنامههای کاربردی پیش میبرند. قابل ذکر است که انویدیا و AMD با دانشگاه استنفورد برای توسعه یک کلاینت با شتاب GPU برای پروژه محاسباتی توزیعشده Folding@home که به شبیهسازیهای تاشو پروتئین اختصاص دارد، همکاری کردند. تحت شرایط خاص، GPU میتواند محاسبات را تا چهل برابر سریعتر از CPUهایی که در گذشته برای این نوع برنامهها به کار میرفتند، انجام دهد.
سیستمهای محاسباتی با کارایی بالا با شتاب واحد پردازش گرافیکی در تسهیل مدلسازی محاسباتی در مقیاس بزرگ نقش اساسی دارند. در حال حاضر، سه تا از ده ابررایانه برتر دنیا از شتاب GPU برای دستیابی به قدرت محاسباتی خود استفاده می کنند.
از سال 2005، علاقه قابل توجهی به استفاده از قابلیتهای محاسباتی GPUها برای محاسبات تکاملی عمومی، بهویژه برای تسریع ارزیابی تناسب اندام در برنامهنویسی ژنتیکی، پدیدار شد. متدولوژی های غالب شامل کامپایل برنامه های خطی یا درختی بر روی کامپیوتر میزبان و متعاقبا انتقال کد اجرایی به GPU برای اجرا می باشد. دستاوردهای عملکرد معمولاً با اجرای همزمان یک برنامه فعال واحد در چندین نمونه مشکل موازی، با بهرهبرداری از معماری تک دستورالعمل، دادههای چندگانه (SIMD) GPU محقق میشود. علاوه بر این، شتاب قابل توجهی را می توان با کامپایل برنامه قبلی و در عوض انتقال مستقیم برنامه ها به GPU برای تفسیر به دست آورد.
GPU خارجی (eGPU)
یک GPU را می توان از طریق یک گذرگاه خارجی با یک نوت بوک وصل کرد و PCI Express استاندارد انحصاری استفاده شده برای این برنامه است. انواع پورت های موجود عبارتند از، اما نه محدود به، ExpressCard یا mPCIe (PCIe × 1، به ترتیب تا 5 یا 2.5 گیگابیت در ثانیه ارائه می دهد)، Thunderbolt 1، 2، یا 3 (PCIe ×4، ارائه حداکثر 10، 20، یا 40 گیگابیت سازگاری با USBTu، به ترتیب با Thunderbolt4) OCuLink. در دسترس بودن این پورت ها منوط به پیکربندی سیستم نوت بوک خاص است. محفظههای GPU خارجی به دلیل مصرف انرژی قابل توجه، به طور بالقوه صدها وات، پردازندههای گرافیکی با کارایی بالا، نیاز به یک واحد منبع تغذیه مستقل (PSU) دارند.
کارایی انرژی
فروش
محمولههای GPU جهانی به 438.3 میلیون واحد در سال 2013 رسید که کاهش پیشبینیشده به 414.2 میلیون دستگاه برای سال 2014 خواهد بود.
سخت افزار
سخت افزار
- لیست واحدهای پردازش گرافیکی AMD
- لیست واحدهای پردازش گرافیکی Nvidia
- لیست واحدهای پردازش گرافیکی اینتل
- فهرست واحدهای پردازش گرافیکی گسسته و یکپارچه
- Intel GMA
- لارابی
- Nvidia PureVideo یک فناوری بیتاستریم است که توسط انویدیا توسعه یافته است و در تراشههای گرافیکی آن ادغام شده است تا رمزگشایی ویدیو با سرعت سختافزار را در GPUهایی که از DXVA استفاده میکنند، تسهیل کند.
- SoC
- UVD (رمزگشا ویدیوی یکپارچه) فناوری بیتاستریم رمزگشایی ویدیوی ATI را نشان میدهد که برای فعال کردن رمزگشایی پردازنده گرافیکی با شتاب سختافزاری از طریق DXVA طراحی شده است.
API
برنامه ها
- خوشه GPU
- Mathematica از پشتیبانی بومی برای اجرای GPU از طریق چارچوبهای CUDA و OpenCL استفاده میکند.
- مدلسازی مولکولی در GPU
- Deeplearning4j یک چارچوب یادگیری عمیق منبع باز و توزیع شده است که به طور خاص برای محیط های جاوا طراحی شده است.
افراد
- فهرست همنامهای ریزمعماری GPU Nvidia
مراجع
منابع
- پدی، جان (1 ژانویه 2023). تاریخچه GPU – تحولات جدید. Springer Nature. ISBN 978-3-03-114047-1. OCLC 1356877844.