quickmenu
PC ´º½º Ȩ  

AMD, CNDA ¾ÆÅ°ÅØÃ³ ±â¹Ý Ãʰí¼Ó HPC °¡¼Ó±â MI100 ¹ßÇ¥

2020-11-17 09:53
ÀÌ»óÈ£ ±âÀÚ ghostlee@bodnara.co.kr

AMD°¡ x86 ¼­¹ö GPU ÃÖÃÊ·Î 10 Å×¶óÇ÷ӽº(FP64) ÀÌ»óÀÇ ¼º´ÉÀ» Áö¿øÇÏ´Â ¼¼°è ÃÖ°í ¼º´ÉÀÇ °í¼º´É ÄÄÇ»ÆÃ(HPC) GPUÀÎ AMD ÀνºÆÃÆ® MI100(AMD Instinct MI100)¸¦ ¹ßÇ¥Çß´Ù.

AMD ÀνºÆÃÆ® MI1000Àº µ¨(Dell), ÈÞ·¿ÆÑÄ¿µå ¿£ÅÍÇÁ¶óÀÌÁî(HPE), ±â°¡¹ÙÀÌÆ®(Gigabyte), ½´ÆÛ¸¶ÀÌÅ©·Î(Supermicro) µî ÆÄÆ®³Ê»çÀÇ °¡¼Ó ÄÄÇ»ÆÃ Ç÷§Æû°ú AMD ¿¡ÇÈ(AMD EPYC) ÇÁ·Î¼¼¼­, ±×¸®°í ROCm 4.0 ¿ÀÇ ¼ÒÇÁÆ®¿þ¾î Ç÷§Æû°ú ȣȯµÇ´Â µ¿½Ã¿¡ µµ·¡ÇÏ´Â ¿¢»ç½ºÄÉÀÏ ½Ã´ë¿¡ ´Ù¾çÇÑ ¿¬±¸ Ȱµ¿À» Áö¿øÇϱâ À§ÇØ ¼³°èµÆ´Ù. 

»õ·Î¿î AMD CDNA ¾ÆÅ°ÅØÃ³ ±â¹ÝÀÇ AMD ÀνºÆÃÆ® MI100 GPU´Â AMD ¿¡ÇÈ ÇÁ·Î¼¼¼­¿Í ÇÔ²² HPC ¹× AI ±â¼ú ¹ßÀüÀ» À§ÇÑ »õ·Î¿î ¼öÁØÀÇ °¡¼Ó ½Ã½ºÅÛÀ» Áö¿øÇÑ´Ù. MI100Àº HPC¿¡¼­ ÃÖ´ë 11.5 Å×¶óÇ÷ӽºÀÇ ÃÖ´ë FP64 ¼º´ÉÀ» Áö¿øÇϸç, AI ¹× ¸Ó½Å ·¯´× ¿öÅ©·Îµå¿¡¼­´Â ÃÖ´ë 46.1 Å×¶óÇ÷ӽºÀÇ ÃÖ´ë FP32 ¸ÅÆ®¸¯½º(Matrix) ¼º´ÉÀ» Áö¿øÇÑ´Ù.

MI100Àº FP32, FP16, bFloat16, Int8, Int4 µî ¸ðµç ¹üÀ§ÀÇ ´ÜÀÏ ¹× È¥ÇÕ Á¤¹Ð ¸ÅÆ®¸¯½º ¿¬»êÀ» À§ÇØ °³¹ßµÈ »õ·Î¿î AMD ¸ÅÆ®¸¯½º ÄÚ¾î(AMD Matrix Core) ±â¼úÀ» ÅëÇØ AI Æ®·¹ÀÌ´× ¿öÅ©·Îµå¿¡¼­ ÀüÀÛ ´ëºñ 7¹è Çâ»óµÈ FP16 ÃÖ´ë ÀÌ·Ð ºÎµ¿¼Ò¼öÁ¡ ¼º´É(theoretical peak floating point performance)À» Áö¿øÇÑ´Ù.

 

AMD´Â ROCm °³¹ßÀÚ ¼ÒÇÁÆ®¿þ¾î¸¦ ÅëÇØ ¿¢»ç½ºÄÉÀÏ ÄÄÇ»ÆÃÀ» À§ÇÑ ±â¹ÝÀ» Á¦°øÇÑ´Ù. ROCmÀº ÄÄÆÄÀÏ·¯(compiler), ÇÁ·Î±×·¡¹Ö API ¹× ¶óÀ̺귯¸®·Î ±¸¼ºµÈ ¿ÀǼҽº Åø¼ÂÀ¸·Î, ¿¢»ç½ºÄÉÀÏ ¼ÒÇÁÆ®¿þ¾î °³¹ßÀÚµéÀÇ °í¼º´É ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀ» µ½´Â´Ù. ¶ÇÇÑ, ROCm 4.0Àº MI100 ±â¹Ý ½Ã½ºÅÛÀÇ ±Ô¸ð¿¡ ¸Â°Ô ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ÄÄÆÄÀÏ·¯¸¦ ¿ÀǼҽº·Î ¾÷±×·¹À̵åÇϰí OpenMP¿Í HIP¸¦ ¸ðµÎ Áö¿øÇϵµ·Ï ÅëÇÕÇß´Ù.

ÆÄÀÌÅäÄ¡(PyTorch) ¹× ÅÙ¼­Ç÷οì(Tensorflow) ÇÁ·¹ÀÓ¿öÅ©´Â MI100¸¦ ÅëÇØ ´õ ³ôÀº ¼º´ÉÀ» Á¦°øÇÒ ¼ö ÀÖµµ·Ï ROCm 4.0¿¡ ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ROCm 4.0Àº HPC, ML ¹× AI ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀÚµéÀÌ ¶Ù¾î³­ ¼º´ÉÀÇ ÈÞ´ë¿ë ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ßÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ°Ô µÇ¾ú´Ù.

MI100Àº ÃÖ´ë 2¹è ³ôÀº PCIe 4.0 ÀÌ»óÀÇ P2P(peer-to-peer) ÃÖ´ë I/O ´ë¿ªÆø°ú GPU´ç ÃÊ´ç ÃÖ´ë 340GBÀÇ ÅëÇÕ ´ë¿ªÆøÀ» Áö¿øÇÏ´Â AMD ÀÎÇÇ´ÏÆ¼ ÆÐºê¸¯ ¸µÅ©(Links)¸¦ Á¦°øÇÑ´Ù. ¼­¹ö ³»¿¡¼­ MI100 GPU´Â ÃÖ´ë µÎ °³ÀÇ ¿¬°áµÈ Äõµå GPU ÇÏÀ̺ê(hive)¸¦ ±¸¼ºÇÒ ¼ö ÀÖÀ¸¸ç, ÃÊ´ç 552GBÀÇ P2P I/O ´ë¿ªÆøÀ¸·Î ºü¸¥ µ¥ÀÌÅÍ °øÀ¯¸¦ Áö¿øÇÑ´Ù.

32GBÀÇ °í´ë¿ªÆø HBM2 ¸Þ¸ð¸®¸¦ ÅëÇØ 1.2GHzÀÇ Å¬·° ¼Óµµ¿Í ÃÊ´ç 1.23GBÀÇ Ãʰí´ë¿ª ¸Þ¸ð¸® ´ë¿ªÆøÀ¸·Î ´ë¿ë·®ÀÇ µ¥ÀÌÅ͸¦ Áö¿øÇÏ°í ¸Þ¸ð¸®¿¡ µ¥ÀÌÅ͸¦ ÀúÀåÇϰí ÃßÃâÇÏ´Â °úÁ¤¿¡¼­ ¹ß»ýÇÏ´Â º´¸ñÇö»óÀ» ÇØ°áÇÏ´Â µ¥ µµ¿òÀ» ÁØ´Ù.

AMD ÀνºÆÃÆ® MI100 ¾×¼¿·¯·¹ÀÌÅÍ´Â 2020³â ¸»ºÎÅÍ ÁÖ¿ä OEM ¹× ODM ÆÄÆ®³Ê»çµéÀ» ÅëÇØ Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù.

´Ð³×ÀÓ lock
ºñȸ¿ø

º¸µå³ª¶ó ¸¹ÀÌ º» ´º½º
º¸µå³ª¶ó ¸¹ÀÌ º» ±â»ç

º¸µå³ª¶ó Ãֽбâ»ç
[11/17] ¿£ºñµð¾Æ, ¼­¿ï¼­ ÁöÆ÷½º ÇÁ·¹½º ÄÜÆÛ·±½º °³ÃÖ  
[11/17] ¿©ÀǽýºÅÛ, ¿§Áö AI °­ÀÚ ¡®½ÅÄÚÁî(Cincoze)¡¯·Î °í¼º´É »ê¾÷¿ë ÄÄÇ»ÆÃ ½ÃÀå °ø·« °¡¼ÓÈ­  
[11/17] T1 vs KT ·Ñ½ºÅÍ ¡¯¿ùµå èÇǾð½Ê °á½ÂÀü ¸®¸ÅÄ¡¡¯ ¼º»ç  
[11/17] ÇÏÀ̽ºÄÚ¾î°ÔÀÓÁî, ¡®¸ÓÁö ¸ÞÀ̵å Ä«Æä¡¯ ½Å±Ô ¸ÞÀÌµå ¡®¾ÆÀÌÄÚ¡¯ ¾÷µ¥ÀÌÆ® ½Ç½Ã  
[11/17] ¡®µà¿§ ³ªÀÌÆ® ¾îºñ½º¡¯, 2026³â ù ¾÷µ¥ÀÌÆ® Àû¿ë µ¿½Ã¿¡ ½ºÆÀ ¹öÀü Á¤½Ä Ãâ½Ã  
[11/17] ÄÄÅõ½º ¡®¼­¸Ó³ÊÁî ¿ö¡¯, ¡®¹ÝÁöÀÇ Á¦¿Õ¡¯ ¸¸³­´Ù! ƼÀú ¿µ»ó °ø°³  
[11/17] ¾×¼Ç RPG ¡®´ÙÅ©µð¼À¹ö¡¯, PC¡¤¸ð¹ÙÀÏ Å©·Î½ºÇ÷¹ÀÌ·Î Á¤½Ä Ãâ½Ã  
[11/17] ÇÁ·ÎÁ§Å͸ŴϾÆ, ¿ÉÅ丶 AZH500 ´Üµ¶ 53% ÇÒÀÎÇà»ç ÁøÇà  
[11/17] º¥Å¥, ¼¿ºò°ú µðÁöÅÐ ÄÜÅÙÃ÷, °ø°£ ¼Ö·ç¼Ç »ç¾÷ Çù·ÂÀ» À§ÇÑ ¾÷¹« Çù¾à ü°á  
[11/17] ³ªÀÎÅ×Å©, CES 2026¼­ ¿­Àü¼ÒÀÚ Àû¿ë È®´ë °¡´É¼º È®ÀÎ  
[11/17] ¾ÛÄÚ, 120Hz °íÁÖ»çÀ²°ú IPS ÆÐ³ÎÀ» °®Ãá ¡®ÇÏÀÌÆÛºä 27F120¡¯ ¸ð´ÏÅÍ Ãâ½Ã  
[11/17] ¿ø½º ÈÞ¸Õ, 1¿ù 22ÀÏ ´ë±Ô¸ð ¾÷µ¥ÀÌÆ® ¹ßÇ¥. ½ÃÁð3 µ¹ÀÔ  
[11/17] CONX, ÄÄÅõ½ºÈ¦µù½º¿Í ÇÔ²²ÇÑ ¡®³ð ¾Æ·¹³ª¡¯ ¼ö»óÀÛ ¹ßÇ¥  
[11/17] VCT ÆÛ½ÃÇÈ, ¿ÃÇØ È£Âî¹Î°ú ºÎ»ê¿¡¼­ µÎ Â÷·Ê ·Îµå¼î °³ÃÖ  
[11/17] °¡ºñ¾Æ, ±¹³» ¾÷°è ÃÖÃÊ ¡®AI µµ¸ÞÀÎ Ãßõ ¼­ºñ½º¡¯ ¿ÀÇ  
[11/17] ¾Ë¾à ¸®´ª½º ¼­¹ö,Arm ¼­¹ö °ø½Ä Áö¿ø¡¦Â÷¼¼´ë ÀÎÇÁ¶ó º¸¾È Àü·« ±¸Ã¼È­  
[11/17] ¹ë·ÎÇÁ ÀÌÄ«·ç½º ¿Â¶óÀÎ, ÃÖ´ë ·¹º§ 85 È®Àå ¹× ½Å±Ô ÇÊµå ¡®Ä«¸£ÀÚ½ºÀÇ ¾Ï½ÃÀ塯 ¾÷µ¥ÀÌÆ® ½Ç½Ã  
[11/17] ·ÎÁöÅØ, ÇÁ·Î°ÔÀÓ´Ü ºê¸®¿Â°ú ÆÄÆ®³Ê½Ê ü°á  
[11/17] À¥Á¨, ¿ÀÇ¿ùµå ¾×¼ÇRPG ½ÅÀÛ ¡®µå·¡°ï¼Òµå¡¯ »çÀü ´Ù¿î·Îµå ½ÃÀÛ  
[11/17] ¼­¸°¾¾¾Ø¾ÆÀÌ, AGI DDR5-6000 CL30 TURBOJET UD858 RGB 48GB ÆÐŰÁö Ãß°¡ Ãâ½Ã  
·Î±×ÀÎ | ÀÌ ÆäÀÌÁöÀÇ PC¹öÀü
Copyright NexGen Research Corp. 2010