PC ´º½º Ȩ Àαâ PC ´º½º

AMD, CNDA ¾ÆÅ°ÅØó ±â¹Ý ÃÊ°í¼Ó HPC °¡¼Ó±â MI100 ¹ßÇ¥

2020-11-17 09:53
ÀÌ»óÈ£ ±âÀÚ ghostlee@bodnara.co.kr

AMD°¡ x86 ¼­¹ö GPU ÃÖÃÊ·Î 10 Å׶óÇ÷ӽº(FP64) ÀÌ»óÀÇ ¼º´ÉÀ» Áö¿øÇÏ´Â ¼¼°è ÃÖ°í ¼º´ÉÀÇ °í¼º´É ÄÄÇ»ÆÃ(HPC) GPUÀÎ AMD ÀνºÆÃÆ® MI100(AMD Instinct MI100)¸¦ ¹ßÇ¥Çß´Ù.

AMD ÀνºÆÃÆ® MI1000Àº µ¨(Dell), ÈÞ·¿ÆÑÄ¿µå ¿£ÅÍÇÁ¶óÀÌÁî(HPE), ±â°¡¹ÙÀÌÆ®(Gigabyte), ½´ÆÛ¸¶ÀÌÅ©·Î(Supermicro) µî ÆÄÆ®³Ê»çÀÇ °¡¼Ó ÄÄÇ»Æà Ç÷§Æû°ú AMD ¿¡ÇÈ(AMD EPYC) ÇÁ·Î¼¼¼­, ±×¸®°í ROCm 4.0 ¿ÀÇ ¼ÒÇÁÆ®¿þ¾î Ç÷§Æû°ú ȣȯµÇ´Â µ¿½Ã¿¡ µµ·¡ÇÏ´Â ¿¢»ç½ºÄÉÀÏ ½Ã´ë¿¡ ´Ù¾çÇÑ ¿¬±¸ È°µ¿À» Áö¿øÇϱâ À§ÇØ ¼³°èµÆ´Ù. 

»õ·Î¿î AMD CDNA ¾ÆÅ°ÅØó ±â¹ÝÀÇ AMD ÀνºÆÃÆ® MI100 GPU´Â AMD ¿¡ÇÈ ÇÁ·Î¼¼¼­¿Í ÇÔ²² HPC ¹× AI ±â¼ú ¹ßÀüÀ» À§ÇÑ »õ·Î¿î ¼öÁØÀÇ °¡¼Ó ½Ã½ºÅÛÀ» Áö¿øÇÑ´Ù. MI100Àº HPC¿¡¼­ ÃÖ´ë 11.5 Å׶óÇ÷ӽºÀÇ ÃÖ´ë FP64 ¼º´ÉÀ» Áö¿øÇϸç, AI ¹× ¸Ó½Å ·¯´× ¿öÅ©·Îµå¿¡¼­´Â ÃÖ´ë 46.1 Å׶óÇ÷ӽºÀÇ ÃÖ´ë FP32 ¸ÅÆ®¸¯½º(Matrix) ¼º´ÉÀ» Áö¿øÇÑ´Ù.

MI100Àº FP32, FP16, bFloat16, Int8, Int4 µî ¸ðµç ¹üÀ§ÀÇ ´ÜÀÏ ¹× È¥ÇÕ Á¤¹Ð ¸ÅÆ®¸¯½º ¿¬»êÀ» À§ÇØ °³¹ßµÈ »õ·Î¿î AMD ¸ÅÆ®¸¯½º ÄÚ¾î(AMD Matrix Core) ±â¼úÀ» ÅëÇØ AI Æ®·¹ÀÌ´× ¿öÅ©·Îµå¿¡¼­ ÀüÀÛ ´ëºñ 7¹è Çâ»óµÈ FP16 ÃÖ´ë ÀÌ·Ð ºÎµ¿¼Ò¼öÁ¡ ¼º´É(theoretical peak floating point performance)À» Áö¿øÇÑ´Ù.

 

AMD´Â ROCm °³¹ßÀÚ ¼ÒÇÁÆ®¿þ¾î¸¦ ÅëÇØ ¿¢»ç½ºÄÉÀÏ ÄÄÇ»ÆÃÀ» À§ÇÑ ±â¹ÝÀ» Á¦°øÇÑ´Ù. ROCmÀº ÄÄÆÄÀÏ·¯(compiler), ÇÁ·Î±×·¡¹Ö API ¹× ¶óÀ̺귯¸®·Î ±¸¼ºµÈ ¿ÀǼҽº Åø¼ÂÀ¸·Î, ¿¢»ç½ºÄÉÀÏ ¼ÒÇÁÆ®¿þ¾î °³¹ßÀÚµéÀÇ °í¼º´É ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀ» µ½´Â´Ù. ¶ÇÇÑ, ROCm 4.0Àº MI100 ±â¹Ý ½Ã½ºÅÛÀÇ ±Ô¸ð¿¡ ¸Â°Ô ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ÄÄÆÄÀÏ·¯¸¦ ¿ÀǼҽº·Î ¾÷±×·¹À̵åÇÏ°í OpenMP¿Í HIP¸¦ ¸ðµÎ Áö¿øÇϵµ·Ï ÅëÇÕÇß´Ù.

ÆÄÀÌÅäÄ¡(PyTorch) ¹× ÅÙ¼­Ç÷οì(Tensorflow) ÇÁ·¹ÀÓ¿öÅ©´Â MI100¸¦ ÅëÇØ ´õ ³ôÀº ¼º´ÉÀ» Á¦°øÇÒ ¼ö ÀÖµµ·Ï ROCm 4.0¿¡ ÃÖÀûÈ­µÇ¾úÀ¸¸ç, ROCm 4.0Àº HPC, ML ¹× AI ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀÚµéÀÌ ¶Ù¾î³­ ¼º´ÉÀÇ ÈÞ´ë¿ë ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ßÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ°Ô µÇ¾ú´Ù.

MI100Àº ÃÖ´ë 2¹è ³ôÀº PCIe 4.0 ÀÌ»óÀÇ P2P(peer-to-peer) ÃÖ´ë I/O ´ë¿ªÆø°ú GPU´ç ÃÊ´ç ÃÖ´ë 340GBÀÇ ÅëÇÕ ´ë¿ªÆøÀ» Áö¿øÇÏ´Â AMD ÀÎÇÇ´ÏƼ Æк긯 ¸µÅ©(Links)¸¦ Á¦°øÇÑ´Ù. ¼­¹ö ³»¿¡¼­ MI100 GPU´Â ÃÖ´ë µÎ °³ÀÇ ¿¬°áµÈ Äõµå GPU ÇÏÀ̺ê(hive)¸¦ ±¸¼ºÇÒ ¼ö ÀÖÀ¸¸ç, ÃÊ´ç 552GBÀÇ P2P I/O ´ë¿ªÆøÀ¸·Î ºü¸¥ µ¥ÀÌÅÍ °øÀ¯¸¦ Áö¿øÇÑ´Ù.

32GBÀÇ °í´ë¿ªÆø HBM2 ¸Þ¸ð¸®¸¦ ÅëÇØ 1.2GHzÀÇ Å¬·° ¼Óµµ¿Í ÃÊ´ç 1.23GBÀÇ ÃÊ°í´ë¿ª ¸Þ¸ð¸® ´ë¿ªÆøÀ¸·Î ´ë¿ë·®ÀÇ µ¥ÀÌÅ͸¦ Áö¿øÇÏ°í ¸Þ¸ð¸®¿¡ µ¥ÀÌÅ͸¦ ÀúÀåÇÏ°í ÃßÃâÇÏ´Â °úÁ¤¿¡¼­ ¹ß»ýÇÏ´Â º´¸ñÇö»óÀ» ÇØ°áÇÏ´Â µ¥ µµ¿òÀ» ÁØ´Ù.

AMD ÀνºÆÃÆ® MI100 ¾×¼¿·¯·¹ÀÌÅÍ´Â 2020³â ¸»ºÎÅÍ ÁÖ¿ä OEM ¹× ODM ÆÄÆ®³Ê»çµéÀ» ÅëÇØ Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù.

´Ð³×ÀÓ
ºñȸ¿ø

º¸µå³ª¶ó ¸¹ÀÌ º» ´º½º
º¸µå³ª¶ó ¸¹ÀÌ º» ±â»ç
·Î±×ÀÎ | ÀÌ ÆäÀÌÁöÀÇ PC¹öÀü
Copyright NexGen Research Corp. 2010