quickmenu
PC ´º½º Ȩ  

AMD, CNDA ¾ÆÅ°ÅØÃ³ ±â¹Ý Ãʰí¼Ó HPC °¡¼Ó±â MI100 ¹ßÇ¥

2020-11-17 09:53
ÀÌ»óÈ£ ±âÀÚ ghostlee@bodnara.co.kr

AMD°¡ x86 ¼­¹ö GPU ÃÖÃÊ·Î 10 Å×¶óÇ÷ӽº(FP64) ÀÌ»óÀÇ ¼º´ÉÀ» Áö¿øÇÏ´Â ¼¼°è ÃÖ°í ¼º´ÉÀÇ °í¼º´É ÄÄÇ»ÆÃ(HPC) GPUÀÎ AMD ÀνºÆÃÆ® MI100(AMD Instinct MI100)¸¦ ¹ßÇ¥Çß´Ù.

AMD ÀνºÆÃÆ® MI1000Àº µ¨(Dell), ÈÞ·¿ÆÑÄ¿µå ¿£ÅÍÇÁ¶óÀÌÁî(HPE), ±â°¡¹ÙÀÌÆ®(Gigabyte), ½´ÆÛ¸¶ÀÌÅ©·Î(Supermicro) µî ÆÄÆ®³Ê»çÀÇ °¡¼Ó ÄÄÇ»ÆÃ Ç÷§Æû°ú AMD ¿¡ÇÈ(AMD EPYC) ÇÁ·Î¼¼¼­, ±×¸®°í ROCm 4.0 ¿ÀÇ ¼ÒÇÁÆ®¿þ¾î Ç÷§Æû°ú ȣȯµÇ´Â µ¿½Ã¿¡ µµ·¡ÇÏ´Â ¿¢»ç½ºÄÉÀÏ ½Ã´ë¿¡ ´Ù¾çÇÑ ¿¬±¸ Ȱµ¿À» Áö¿øÇϱâ À§ÇØ ¼³°èµÆ´Ù. 

»õ·Î¿î AMD CDNA ¾ÆÅ°ÅØÃ³ ±â¹ÝÀÇ AMD ÀνºÆÃÆ® MI100 GPU´Â AMD ¿¡ÇÈ ÇÁ·Î¼¼¼­¿Í ÇÔ²² HPC ¹× AI ±â¼ú ¹ßÀüÀ» À§ÇÑ »õ·Î¿î ¼öÁØÀÇ °¡¼Ó ½Ã½ºÅÛÀ» Áö¿øÇÑ´Ù. MI100Àº HPC¿¡¼­ ÃÖ´ë 11.5 Å×¶óÇ÷ӽºÀÇ ÃÖ´ë FP64 ¼º´ÉÀ» Áö¿øÇϸç, AI ¹× ¸Ó½Å ·¯´× ¿öÅ©·Îµå¿¡¼­´Â ÃÖ´ë 46.1 Å×¶óÇ÷ӽºÀÇ ÃÖ´ë FP32 ¸ÅÆ®¸¯½º(Matrix) ¼º´ÉÀ» Áö¿øÇÑ´Ù.

MI100Àº FP32, FP16, bFloat16, Int8, Int4 µî ¸ðµç ¹üÀ§ÀÇ ´ÜÀÏ ¹× È¥ÇÕ Á¤¹Ð ¸ÅÆ®¸¯½º ¿¬»êÀ» À§ÇØ °³¹ßµÈ »õ·Î¿î AMD ¸ÅÆ®¸¯½º ÄÚ¾î(AMD Matrix Core) ±â¼úÀ» ÅëÇØ AI Æ®·¹ÀÌ´× ¿öÅ©·Îµå¿¡¼­ ÀüÀÛ ´ëºñ 7¹è Çâ»óµÈ FP16 ÃÖ´ë ÀÌ·Ð ºÎµ¿¼Ò¼öÁ¡ ¼º´É(theoretical peak floating point performance)À» Áö¿øÇÑ´Ù.

 

AMD´Â ROCm °³¹ßÀÚ ¼ÒÇÁÆ®¿þ¾î¸¦ ÅëÇØ ¿¢»ç½ºÄÉÀÏ ÄÄÇ»ÆÃÀ» À§ÇÑ ±â¹ÝÀ» Á¦°øÇÑ´Ù. ROCmÀº ÄÄÆÄÀÏ·¯(compiler), ÇÁ·Î±×·¡¹Ö API ¹× ¶óÀ̺귯¸®·Î ±¸¼ºµÈ ¿ÀǼҽº Åø¼ÂÀ¸·Î, ¿¢»ç½ºÄÉÀÏ ¼ÒÇÁÆ®¿þ¾î °³¹ßÀÚµéÀÇ °í¼º´É ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀ» µ½´Â´Ù. ¶ÇÇÑ, ROCm 4.0Àº MI100 ±â¹Ý ½Ã½ºÅÛÀÇ ±Ô¸ð¿¡ ¸Â°Ô ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ÄÄÆÄÀÏ·¯¸¦ ¿ÀǼҽº·Î ¾÷±×·¹À̵åÇϰí OpenMP¿Í HIP¸¦ ¸ðµÎ Áö¿øÇϵµ·Ï ÅëÇÕÇß´Ù.

ÆÄÀÌÅäÄ¡(PyTorch) ¹× ÅÙ¼­Ç÷οì(Tensorflow) ÇÁ·¹ÀÓ¿öÅ©´Â MI100¸¦ ÅëÇØ ´õ ³ôÀº ¼º´ÉÀ» Á¦°øÇÒ ¼ö ÀÖµµ·Ï ROCm 4.0¿¡ ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ROCm 4.0Àº HPC, ML ¹× AI ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀÚµéÀÌ ¶Ù¾î³­ ¼º´ÉÀÇ ÈÞ´ë¿ë ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ßÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ°Ô µÇ¾ú´Ù.

MI100Àº ÃÖ´ë 2¹è ³ôÀº PCIe 4.0 ÀÌ»óÀÇ P2P(peer-to-peer) ÃÖ´ë I/O ´ë¿ªÆø°ú GPU´ç ÃÊ´ç ÃÖ´ë 340GBÀÇ ÅëÇÕ ´ë¿ªÆøÀ» Áö¿øÇÏ´Â AMD ÀÎÇÇ´ÏÆ¼ ÆÐºê¸¯ ¸µÅ©(Links)¸¦ Á¦°øÇÑ´Ù. ¼­¹ö ³»¿¡¼­ MI100 GPU´Â ÃÖ´ë µÎ °³ÀÇ ¿¬°áµÈ Äõµå GPU ÇÏÀ̺ê(hive)¸¦ ±¸¼ºÇÒ ¼ö ÀÖÀ¸¸ç, ÃÊ´ç 552GBÀÇ P2P I/O ´ë¿ªÆøÀ¸·Î ºü¸¥ µ¥ÀÌÅÍ °øÀ¯¸¦ Áö¿øÇÑ´Ù.

32GBÀÇ °í´ë¿ªÆø HBM2 ¸Þ¸ð¸®¸¦ ÅëÇØ 1.2GHzÀÇ Å¬·° ¼Óµµ¿Í ÃÊ´ç 1.23GBÀÇ Ãʰí´ë¿ª ¸Þ¸ð¸® ´ë¿ªÆøÀ¸·Î ´ë¿ë·®ÀÇ µ¥ÀÌÅ͸¦ Áö¿øÇÏ°í ¸Þ¸ð¸®¿¡ µ¥ÀÌÅ͸¦ ÀúÀåÇϰí ÃßÃâÇÏ´Â °úÁ¤¿¡¼­ ¹ß»ýÇÏ´Â º´¸ñÇö»óÀ» ÇØ°áÇÏ´Â µ¥ µµ¿òÀ» ÁØ´Ù.

AMD ÀνºÆÃÆ® MI100 ¾×¼¿·¯·¹ÀÌÅÍ´Â 2020³â ¸»ºÎÅÍ ÁÖ¿ä OEM ¹× ODM ÆÄÆ®³Ê»çµéÀ» ÅëÇØ Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù.

´Ð³×ÀÓ lock
ºñȸ¿ø

º¸µå³ª¶ó ¸¹ÀÌ º» ´º½º
º¸µå³ª¶ó ¸¹ÀÌ º» ±â»ç

º¸µå³ª¶ó Ãֽбâ»ç
[11/17] ³Ø½á¾²-Ç÷¹ÀÌÀ§µåÄÚ¸®¾Æ, '¾ÁM ±Û·Î¹ú' °øµ¿ ÆÛºí¸®½Ì °è¾à ü°á  
[11/17] AWS, ±âÁ¸ ÀÎÇÁ¶ó¸¦ °í¼º´É AI ȯ°æÀ¸·Î ÀüȯÇÏ´Â ¡®AWS AI ÆÑÅ丮¡¯ ¹ßÇ¥  
[11/17] ¼­¸°¾¾¾Ø¾ÆÀÌ, ÇÁ·ºÅ» µðÀÚÀÎ PCÄÉÀ̽º °Ü¿ï Ư°¡ À̺¥Æ® ÁøÇà  
[11/17] ±×¶óºñƼ, ¹æÄ¡Çü RPG ¡®¶ó±×³ª·ÎÅ© ¾ÆÀÌµé ¾îµåº¥Ã³ PLUS¡¯ ¿ø½ºÅä¾î ¹× °¶·°½Ã ½ºÅä¾î Á¤½Ä ·ÐĪ!  
[11/17] 'µà¿§ ³ªÀÌÆ® ¾îºñ½º', ½Å±Ô ij¸¯ÅÍ ¡®Çdzª¡¯ EP¿Í OST ¾Ù¹ü µ¿½Ã ¹ß¸Å  
[11/17] ¡®¿¡¿À½º ºí·¢¡¯ 1.5Áֳ⠾÷µ¥ÀÌÆ® ¹× °ú±Ý Á¦ÇÑ ¼­¹ö »ï¹é III »çÀü¿¹¾à ½ÃÀÛ!  
[11/17] ³Ý¸¶ºí, TGA 2025 ÅëÇØ 'Àϰö °³ÀÇ ´ëÁË: Origin' ½Å±Ô Æ®·¹ÀÏ·¯ °ø°³ ¿¹°í  
[11/17] ipTIME, Å©¸®½º¸¶½º ¸ÂÀÌ ipTIME AX3000SE, AX2004T Ư°¡ À̺¥Æ® ÁøÇà  
[11/17] ¹èƲ±×¶ó¿îµå ¸ð¹ÙÀÏ, Æ÷¸£½¦¿Í Çù¾÷À¸·Î Á¤¹ÐÇÔ°ú ÆÄ¿ö¸¦ ¼±»ç  
[11/17] ³Ø½¼, ¡®´õ ÆÄÀ̳νº¡¯ ±×·£µå ÆÄÀ̳Π°á½ÂÀü ¹× 2ÁÖ³â Çà»ç ½Ç½Ã!  
[11/17] ³Ø½¼, ½Å±Ô °³¹ß ÀÚȸ»ç ¡®µô·ÎÄù½ºÆ®¡¯ ¼³¸³  
[11/17] ¡®°æ»ç ±¸Á¶·Î ³Ã°¢ ¼º´É °­È­¡¯ ¸¶ÀÌÅ©·Î´Ð½º, WIZMAX ½½·ÎÇÁ Ãâ½Ã  
[11/17] È÷µç¸ó½ºÅÍ, ¡®¼öÃâÀÇ Å¾¡¯ ¼ö»ó  
[11/17] ¿¡ºê¸®º¿, ¡®³×À̹ö °­¼¼ÀÏ¡¯¼­ ¿ÃÀοø ·Îº¿Ã»¼Ò±â µî ÃÖ´ë 50% ÇÒÀÎ  
[11/17] ³ë¸£µñ ¼¼¹ÌÄÁ´öÅÍ, Â÷¼¼´ë ÇコÄÉ¾î ¿þ¾î·¯ºí ±â±â¸¦ À§ÇÑ »õ·Î¿î ¹«¼± SoC Ãâ½Ã  
[11/17] AMD ¶óÀÌÁ¨ CPU °¡°Ý Àλó ¡ÈÄ ¾ø´Ù  
[11/17] ¡®¼Ò¿ï¸¶½ºÅ©¡¯, ¡®PC °ÔÀÌ¹Ö ¼î: ¸ð½ºÆ® ¿øÆ¼µå¡¯¼­ ÃֽаÔÀÓ Ç÷¹ÀÌ ¿µ»ó °ø°³  
[11/17] °¡·¹³ª ¡®½Å¿ùµ¿Ç࡯, ½Å±Ô ¹öÀü ¡®¼±°èÀÇ ÀÜÇ⡯ ¾÷µ¥ÀÌÆ®!  
[11/17] ¶óÀÌ¿ÂÇÏÆ® ½ºÆ©µð¿À, °³¹ß Á÷±º ä¿ë ¿¬°èÇü ÀÎÅÏ ¸ðÁý  
[11/17] AWS, 5¼¼´ë ¸ÂÃãÇü ÇÁ·Î¼¼¼­ '±×·¡ºñÅæ5' Ãâ½Ã  
·Î±×ÀÎ | ÀÌ ÆäÀÌÁöÀÇ PC¹öÀü
Copyright NexGen Research Corp. 2010