quickmenu
PC ´º½º Ȩ  

AMD, CNDA ¾ÆÅ°ÅØÃ³ ±â¹Ý Ãʰí¼Ó HPC °¡¼Ó±â MI100 ¹ßÇ¥

2020-11-17 09:53
ÀÌ»óÈ£ ±âÀÚ ghostlee@bodnara.co.kr

AMD°¡ x86 ¼­¹ö GPU ÃÖÃÊ·Î 10 Å×¶óÇ÷ӽº(FP64) ÀÌ»óÀÇ ¼º´ÉÀ» Áö¿øÇÏ´Â ¼¼°è ÃÖ°í ¼º´ÉÀÇ °í¼º´É ÄÄÇ»ÆÃ(HPC) GPUÀÎ AMD ÀνºÆÃÆ® MI100(AMD Instinct MI100)¸¦ ¹ßÇ¥Çß´Ù.

AMD ÀνºÆÃÆ® MI1000Àº µ¨(Dell), ÈÞ·¿ÆÑÄ¿µå ¿£ÅÍÇÁ¶óÀÌÁî(HPE), ±â°¡¹ÙÀÌÆ®(Gigabyte), ½´ÆÛ¸¶ÀÌÅ©·Î(Supermicro) µî ÆÄÆ®³Ê»çÀÇ °¡¼Ó ÄÄÇ»ÆÃ Ç÷§Æû°ú AMD ¿¡ÇÈ(AMD EPYC) ÇÁ·Î¼¼¼­, ±×¸®°í ROCm 4.0 ¿ÀÇ ¼ÒÇÁÆ®¿þ¾î Ç÷§Æû°ú ȣȯµÇ´Â µ¿½Ã¿¡ µµ·¡ÇÏ´Â ¿¢»ç½ºÄÉÀÏ ½Ã´ë¿¡ ´Ù¾çÇÑ ¿¬±¸ Ȱµ¿À» Áö¿øÇϱâ À§ÇØ ¼³°èµÆ´Ù. 

»õ·Î¿î AMD CDNA ¾ÆÅ°ÅØÃ³ ±â¹ÝÀÇ AMD ÀνºÆÃÆ® MI100 GPU´Â AMD ¿¡ÇÈ ÇÁ·Î¼¼¼­¿Í ÇÔ²² HPC ¹× AI ±â¼ú ¹ßÀüÀ» À§ÇÑ »õ·Î¿î ¼öÁØÀÇ °¡¼Ó ½Ã½ºÅÛÀ» Áö¿øÇÑ´Ù. MI100Àº HPC¿¡¼­ ÃÖ´ë 11.5 Å×¶óÇ÷ӽºÀÇ ÃÖ´ë FP64 ¼º´ÉÀ» Áö¿øÇϸç, AI ¹× ¸Ó½Å ·¯´× ¿öÅ©·Îµå¿¡¼­´Â ÃÖ´ë 46.1 Å×¶óÇ÷ӽºÀÇ ÃÖ´ë FP32 ¸ÅÆ®¸¯½º(Matrix) ¼º´ÉÀ» Áö¿øÇÑ´Ù.

MI100Àº FP32, FP16, bFloat16, Int8, Int4 µî ¸ðµç ¹üÀ§ÀÇ ´ÜÀÏ ¹× È¥ÇÕ Á¤¹Ð ¸ÅÆ®¸¯½º ¿¬»êÀ» À§ÇØ °³¹ßµÈ »õ·Î¿î AMD ¸ÅÆ®¸¯½º ÄÚ¾î(AMD Matrix Core) ±â¼úÀ» ÅëÇØ AI Æ®·¹ÀÌ´× ¿öÅ©·Îµå¿¡¼­ ÀüÀÛ ´ëºñ 7¹è Çâ»óµÈ FP16 ÃÖ´ë ÀÌ·Ð ºÎµ¿¼Ò¼öÁ¡ ¼º´É(theoretical peak floating point performance)À» Áö¿øÇÑ´Ù.

 

AMD´Â ROCm °³¹ßÀÚ ¼ÒÇÁÆ®¿þ¾î¸¦ ÅëÇØ ¿¢»ç½ºÄÉÀÏ ÄÄÇ»ÆÃÀ» À§ÇÑ ±â¹ÝÀ» Á¦°øÇÑ´Ù. ROCmÀº ÄÄÆÄÀÏ·¯(compiler), ÇÁ·Î±×·¡¹Ö API ¹× ¶óÀ̺귯¸®·Î ±¸¼ºµÈ ¿ÀǼҽº Åø¼ÂÀ¸·Î, ¿¢»ç½ºÄÉÀÏ ¼ÒÇÁÆ®¿þ¾î °³¹ßÀÚµéÀÇ °í¼º´É ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀ» µ½´Â´Ù. ¶ÇÇÑ, ROCm 4.0Àº MI100 ±â¹Ý ½Ã½ºÅÛÀÇ ±Ô¸ð¿¡ ¸Â°Ô ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ÄÄÆÄÀÏ·¯¸¦ ¿ÀǼҽº·Î ¾÷±×·¹À̵åÇϰí OpenMP¿Í HIP¸¦ ¸ðµÎ Áö¿øÇϵµ·Ï ÅëÇÕÇß´Ù.

ÆÄÀÌÅäÄ¡(PyTorch) ¹× ÅÙ¼­Ç÷οì(Tensorflow) ÇÁ·¹ÀÓ¿öÅ©´Â MI100¸¦ ÅëÇØ ´õ ³ôÀº ¼º´ÉÀ» Á¦°øÇÒ ¼ö ÀÖµµ·Ï ROCm 4.0¿¡ ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ROCm 4.0Àº HPC, ML ¹× AI ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀÚµéÀÌ ¶Ù¾î³­ ¼º´ÉÀÇ ÈÞ´ë¿ë ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ßÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ°Ô µÇ¾ú´Ù.

MI100Àº ÃÖ´ë 2¹è ³ôÀº PCIe 4.0 ÀÌ»óÀÇ P2P(peer-to-peer) ÃÖ´ë I/O ´ë¿ªÆø°ú GPU´ç ÃÊ´ç ÃÖ´ë 340GBÀÇ ÅëÇÕ ´ë¿ªÆøÀ» Áö¿øÇÏ´Â AMD ÀÎÇÇ´ÏÆ¼ ÆÐºê¸¯ ¸µÅ©(Links)¸¦ Á¦°øÇÑ´Ù. ¼­¹ö ³»¿¡¼­ MI100 GPU´Â ÃÖ´ë µÎ °³ÀÇ ¿¬°áµÈ Äõµå GPU ÇÏÀ̺ê(hive)¸¦ ±¸¼ºÇÒ ¼ö ÀÖÀ¸¸ç, ÃÊ´ç 552GBÀÇ P2P I/O ´ë¿ªÆøÀ¸·Î ºü¸¥ µ¥ÀÌÅÍ °øÀ¯¸¦ Áö¿øÇÑ´Ù.

32GBÀÇ °í´ë¿ªÆø HBM2 ¸Þ¸ð¸®¸¦ ÅëÇØ 1.2GHzÀÇ Å¬·° ¼Óµµ¿Í ÃÊ´ç 1.23GBÀÇ Ãʰí´ë¿ª ¸Þ¸ð¸® ´ë¿ªÆøÀ¸·Î ´ë¿ë·®ÀÇ µ¥ÀÌÅ͸¦ Áö¿øÇÏ°í ¸Þ¸ð¸®¿¡ µ¥ÀÌÅ͸¦ ÀúÀåÇϰí ÃßÃâÇÏ´Â °úÁ¤¿¡¼­ ¹ß»ýÇÏ´Â º´¸ñÇö»óÀ» ÇØ°áÇÏ´Â µ¥ µµ¿òÀ» ÁØ´Ù.

AMD ÀνºÆÃÆ® MI100 ¾×¼¿·¯·¹ÀÌÅÍ´Â 2020³â ¸»ºÎÅÍ ÁÖ¿ä OEM ¹× ODM ÆÄÆ®³Ê»çµéÀ» ÅëÇØ Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù.

´Ð³×ÀÓ lock
ºñȸ¿ø

º¸µå³ª¶ó ¸¹ÀÌ º» ´º½º
º¸µå³ª¶ó ¸¹ÀÌ º» ±â»ç

º¸µå³ª¶ó Ãֽбâ»ç
[11/17] µîÀåÀº ´Ê¾úÁö¸¸ ¹«¼­¿î ÀáÀç·Â, AMD ¶óµ¥¿Â RX 9060 XT 16GB  
[11/17] ´ÙÅ©¿¡µ§, 6¿ù À̺¥Æ® 3Á¾ ÁøÇà  
[11/17] ³Ý¸¶ºí <Á¦2ÀÇ ³ª¶ó>, 4Áֳ⠱â³ä ´ë±Ô¸ð ¾÷µ¥ÀÌÆ® ½Ç½Ã  
[11/17] ³Ý¸¶ºí <³ª È¥ÀÚ¸¸ ·¹º§¾÷:¾î¶óÀÌÁî>, ½Å±Ô SSR ÇåÅÍ ¡®·¹³ªÆ® ´Ï¾î¸¸¡¯ µî ¾÷µ¥ÀÌÆ®  
[11/17] ÀÌ È¸»ç°¡ ¿ì¸®³ª¶ó°Å¿´¾î?,¹Ì±¹½ÃÀåÀ» ÁÖ¸§Àâ¾Ò´ø Çѱ¹°è ºê·£µå [PCÈï¸Á»ç 13-2]  
[11/17] ³Ø½¼, ¡®FC ¿Â¶óÀΡ¯ ±¹³» ÃÖ»óÀ§ ¸®±× ¡®2025 FSL ½ºÇÁ¸µ¡¯ °á½ÂÀü 6¿ù 14ÀÏ °³ÃÖ!  
[11/17] ¾ÛÄÚ, »óÅ­ÇÑ Ç®¹è¿­ ±â°è½Ä Űº¸µå ¡®AS104¡¯ÀÇ ÅÙ۸®½º ¹öÀü ¡®AS87¡¯ Ãâ½Ã  
[11/17] ¡®Ç÷¹ÀÌÅõ°Ô´õ¡¯ ±«¹°ÀÇ ¹Ù´Ù ¾÷µ¥ÀÌÆ®  
[11/17] Ç÷¹À̱â¾î, FPS °¨¼º ´ãÀº ¡®Ä«ºó M416 °ÔÀָ̹¶¿ì½º ÀåÆÐµå¡¯ Ãâ½Ã  
[11/17] ³Ø½¼, ¡®¸¶ºñ³ë±â ¿µ¿õÀü¡¯ 6¿ù ¼ºÀå Áö¿ø À̺¥Æ® ½Ç½Ã!  
[11/17] SPM, ¹Ì´Ï¸Ö °¨¼ºÀÇ Ç®¹è¿­ ¹«¼± Űº¸µå ¡®PL108W ¾Æ¶ó¡¯ Á¤½Ä Ãâ½Ã  
[11/17] ³ó½É ·¹µåÆ÷½º, ·ÎÁöÅØG¿Í ÇÔ²²ÇÑ ºê·£µå À§Å© ¼ºÈ²¸® Á¾·á  
[11/17] »þÅ©´ÑÀÚ, ¡®´õÇö´ë ¼­¿ï¡¯ ÆË¾÷½ºÅä¾î ¿î¿µ  
[11/17] ¼­¸°¾¾¾Ø¾ÆÀÌ, ÇÏÀÌÆ® Y70 È£½Ã¸¶Ä¡ ½ºÀ̼¼ÀÌ ¿¡µð¼Ç ¿¹¾àÆÇ¸Å  
[11/17] 'ÆÀ ½º¿þµ§' Æú½ºÅ¸'2025 ½º¿þµ§ µ¥ÀÌ' Çà»ç Âü¿©  
[11/17] Çùµ¿À¸·Î »ì¾Æ³²´Â µû¶æÇÑ »ýÁ¸ ¸ðÇè! ¼­¹ÙÀ̹ú ¾îµåº¥Ã³ °ÔÀÓ ¡®¼­¹ÙÀ̹ú ŰÁ, 5ÀÏ Ãâ½Ã!  
[11/17] °ÔÀÓÀ§ ¡®±¤ÁÖ·±´×¸Ç¡¯ °ÔÀÓ »èÁ¦³ë·Â  
[11/17] Åè½¼·ÎÀÌÅÍ, ¡®¸®°ÉÅ×Å© Æ÷·³ 2025¡¯ °³ÃÖ  
[11/17] ¿¡±×¸ó ¿ùµå: Àú´Ï, »çÀü¿¹¾à ½ÃÀÛ Àαâ ij¸¯ÅÍ Æë¼ö µîÀå ¿¹°í  
[11/17] ³Ø½¼, ´øÀü¾ØÆÄÀÌÅÍ ½Å±Ô ÀüÁ÷ Ű¸Þ¶ó/ÆÐ·¯¸Þµñ ¾÷µ¥ÀÌÆ®  
·Î±×ÀÎ | ÀÌ ÆäÀÌÁöÀÇ PC¹öÀü
Copyright NexGen Research Corp. 2010