¿£ºñµð¾Æ(CEO Á¨½¼ Ȳ)°¡ ¿£ºñµð¾Æ(NVIDIA) HGX H200À» Ãâ½ÃÇÑ´Ù°í ¹àÇû´Ù. ÀÌ Ç÷§ÆûÀº ¿£ºñµð¾Æ È£ÆÛ(Hopper) ¾ÆÅ°ÅØó¸¦ ±â¹ÝÀ¸·Î °í±Þ ¸Þ¸ð¸®°¡ ³»ÀåµÈ ¿£ºñµð¾Æ H200 ÅÙ¼ ÄÚ¾î GPU(H200 Tensor Core GPU)¸¦ žÀçÇÏ°í ÀÖ´Ù.
µû¶ó¼ »ý¼ºÇü AI¿Í °í¼º´É ÄÄÇ»Æà ¿öÅ©·Îµå¸¦ À§ÇÑ ¹æ´ëÇÑ ¾çÀÇ µ¥ÀÌÅ͸¦ ó¸®ÇÒ ¼ö ÀÖ´Ù. À̹ø HGX H200 Ãâ½Ã·Î ¼¼°è ÃÖ°í AI ÄÄÇ»Æà Ç÷§ÆûÀ» °¡¼ÓÈÇÒ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÈ´Ù.
¿£ºñµð¾Æ H200Àº HBM3e¸¦ Á¦°øÇÏ´Â ÃÖÃÊÀÇ GPUÀÌ´Ù. HBM3eÀº ´õ ºü¸£°í ´ë¿ë·® ¸Þ¸ð¸®·Î »ý¼ºÇü AI¿Í ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ÀÇ °¡¼Óȸ¦ ÃËÁøÇÏ´Â µ¿½Ã¿¡ HPC ¿öÅ©·Îµå¸¦ À§ÇÑ °úÇÐ ÄÄÇ»ÆÃÀ» ¹ßÀü½ÃŲ´Ù. ¿£ºñµð¾Æ H200Àº HBM3e¸¦ ÅëÇØ ÃÊ´ç 4.8Å׶ó¹ÙÀÌÆ®(Terabytes)ÀÇ ¼Óµµ·Î 141GBÀÇ ¸Þ¸ð¸®¸¦ Á¦°øÇϸç, ÀÌÀü ¸ðµ¨ÀÎ ¿£ºñµð¾Æ A100¿¡ ºñÇØ °ÅÀÇ µÎ ¹è ¿ë·®°ú 2.4¹è ´õ ¸¹Àº ´ë¿ªÆøÀ» Á¦°øÇÑ´Ù.
¼¼°è À¯¼ö ¼¹ö Á¦Á¶¾÷ü¿Í Ŭ¶ó¿ìµå ¼ºñ½º Á¦°ø¾÷üÀÇ H200 ±â¹Ý ½Ã½ºÅÛÀº 2024³â 2ºÐ±â¿¡ Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù.
¿£ºñµð¾Æ È£ÆÛ ¾ÆÅ°ÅØó´Â ÀÌÀü ¹öÀü¿¡ ºñÇØ Àü·Ê ¾ø´Â ¼º´É µµ¾àÀ» Á¦°øÇÑ´Ù. ÃÖ±Ù Ãâ½ÃµÈ ¿£ºñµð¾Æ ÅÙ¼RT-LLM(TensorRT-LLM)°ú °°Àº °·ÂÇÑ ¿ÀÇ ¼Ò½º ¶óÀ̺귯¸®¸¦ ºñ·ÔÇØ H100ÀÇ Áö¼ÓÀûÀÎ ¼ÒÇÁÆ®¿þ¾î °³¼±À» ÅëÇØ °è¼ÓÇؼ ±âÁØÀ» ³ô¿©°¡°í ÀÖ´Ù.
H200 µµÀÔÀ¸·Î 700¾ï °³ÀÇ ÆĶó¹ÌÅ͸¦ º¸À¯ÇÑ LLMÀÎ ¶ó¸¶ 2(Llama 2)ÀÇ Ãß·Ð ¼Óµµ°¡ H100¿¡ ºñÇØ °ÅÀÇ µÎ ¹è·Î »¡¶óÁú °ÍÀ¸·Î ¿¹»óµÈ´Ù. ¶ÇÇÑ ÇâÈÄ ¼ÒÇÁÆ®¿þ¾î ¾÷µ¥ÀÌÆ®¸¦ ÅëÇØ H200ÀÇ Ãß°¡ÀûÀÎ ¼º´É ¸®´õ½Ê°ú °³¼±ÀÌ ±â´ëµÈ´Ù.
¿£ºñµð¾Æ H200Àº 4°³(four-way)¿Í 8°³(eight-way) ±¸¼ºÀÇ ¿£ºñµð¾Æ HGX H200 ¼¹ö º¸µå¿¡¼ »ç¿ëÇÒ ¼ö ÀÖÀ¸¸ç, HGX H200 ½Ã½ºÅÛÀÇ Çϵå¿þ¾î¿Í ¼ÒÇÁÆ®¿þ¾î¿Í ¸ðµÎ ȣȯµÈ´Ù. ¶ÇÇÑ 8¿ù ¹ßÇ¥µÈ HBM3e¸¦ žÀçÇÑ ¿£ºñµð¾Æ GH200 ±×·¹À̽º È£ÆÛ ½´ÆÛĨ(GH200 Grace Hopper Superchip)ÀÌ Æ÷ÇԵȴÙ.
ÀÌ·¯ÇÑ ¼±Åà »çÇ×À» ÅëÇØ H200Àº ¿ÂÇÁ·¹¹Ì½º(on-premises), Ŭ¶ó¿ìµå, ÇÏÀ̺긮µå Ŭ¶ó¿ìµå¿Í ¿§Áö¸¦ ºñ·ÔÇÑ ¸ðµç À¯ÇüÀÇ µ¥ÀÌÅͼ¾ÅÍ¿¡ ¹èÆ÷ÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ ¿£ºñµð¾Æ ±Û·Î¹ú ÆÄÆ®³Ê ¼¹ö Á¦Á¶¾÷ü ¿¡ÄڽýºÅÛÀº ±âÁ¸ ½Ã½ºÅÛÀ» H200·Î ¾÷µ¥ÀÌÆ®ÇÒ ¼ö ÀÖ´Ù. ÆÄÆ®³Ê»ç·Î´Â ¾ÖÁî¶ô·¢(ASRock Rack), ¿¡À̼ö½º(ASUS), µ¨ Å×Å©³î·ÎÁö½º(Dell Technologies), ¿¡ºñµ§(Eviden), ±â°¡¹ÙÀÌÆ®(GIGABYTE), ÈÞ·¿ÆÑÄ¿µå ¿£ÅÍÇÁ¶óÀÌÁî(Hewlett Packard Enterprise), Àα׶ó½Ã½º(Ingrasys), ·¹³ë¹ö(Lenovo), QCT, ½´ÆÛ¸¶ÀÌÅ©·Î(Supermicro), À§½ºÆ®·Ð(Wistron)°ú À§À©(Wiwynn) µîÀÌ Æ÷ÇԵȴÙ.
¾Æ¸¶Á¸À¥¼ºñ½º(Amazon Web Services), ±¸±Û Ŭ¶ó¿ìµå(Google Cloud), ¸¶ÀÌÅ©·Î¼ÒÇÁÆ® ¾ÖÀú(Microsoft Azure)¿Í ¿À¶óŬ Ŭ¶ó¿ìµå ÀÎÇÁ¶ó½ºÆ®·°Ã³(Oracle Cloud Infrastructure)´Â ³»³âºÎÅÍ ÄÚ¾îÀ§ºê(CoreWeave), ¶÷´Ù(Lambda), ¹úÃÄ(Vultr)¿¡ À̾î H200 ±â¹Ý ÀνºÅϽº¸¦ ¹èÆ÷ÇÏ´Â ÃÖÃÊÀÇ Å¬¶ó¿ìµå ¼ºñ½º Á¦°ø¾÷ü Áß Çϳª°¡ µÉ °ÍÀÌ´Ù.
HGX H200Àº ¿£ºñµð¾Æ NV¸µÅ©(NVLink)¿Í NV½ºÀ§Ä¡(NVSwtich) °í¼Ó ÀÎÅÍÄ¿³ØÆ®¸¦ ±â¹ÝÀ¸·Î ÇÑ´Ù. 1,750¾ï °³ ÀÌ»óÀÇ ÆĶó¹ÌÅÍ°¡ Æ÷ÇÔµÈ ´ë±Ô¸ðÀÇ ¸ðµ¨¿¡ ´ëÇÑ LLM ÈƷðú Ãß·Ð µî ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀÌ¼Ç ¿öÅ©·Îµå¿¡¼ ÃÖ°íÀÇ ¼º´ÉÀ» Á¦°øÇÑ´Ù.
8°³ ¹æ½ÄÀ¸·Î ±¸µ¿µÇ´Â HGX H200Àº 32ÆäŸÇ÷Ó(Petaflops) ÀÌ»óÀÇ FP8 µö ·¯´× ÄÄÇ»Æðú ÃÑ 1.1TBÀÇ °í´ë¿ªÆø ¸Þ¸ð¸®¸¦ Á¦°øÇÑ´Ù. À̸¦ ÅëÇØ »ý¼ºÇü AI¿Í HPC ¾ÖÇø®ÄÉÀ̼ǿ¡¼ ÃÖ°íÀÇ ¼º´ÉÀ» ¹ßÈÖÇÑ´Ù.
H200À» ÃÊ°í¼Ó NV¸µÅ©-C2C ÀÎÅÍÄ¿³ØÆ®¸¦ °®Ãá ¿£ºñµð¾Æ ±×·¹À̽º CPU¿Í °áÇÕÇϸé GH200 ±×·¹À̽º È£ÆÛ ½´ÆÛĨÀ» ¸¸µé ¼ö ÀÖ´Ù. ¿©±â¿¡´Â ´ë±Ô¸ð HPC¿Í AI ¾ÖÇø®ÄÉÀ̼ÇÀ» Áö¿øÇϵµ·Ï ¼³°èµÈ ÅëÇÕ ¸ðµâÀÎ HBM3e°¡ Æ÷ÇԵȴÙ.
¿£ºñµð¾Æ °¡¼Ó ÄÄÇ»Æà Ç÷§ÆûÀº °³¹ßÀÚ¿Í ±â¾÷ÀÌ AI¿¡¼ HPC¿¡ À̸£±â±îÁö Áï½Ã »ý»êÀÌ °¡´ÉÇÑ ¾ÖÇø®ÄÉÀ̼ÇÀ» ±¸ÃàÇÏ°í °¡¼ÓÈÇÒ ¼ö ÀÖ´Â °·ÂÇÑ ¼ÒÇÁÆ®¿þ¾î µµ±¸·Î Áö¿øµÈ´Ù. ¿©±â¿¡´Â À½¼º, Ãßõ ½Ã½ºÅÛ, ÇÏÀÌÆÛ½ºÄÉÀÏ Ã߷аú °°Àº ¿öÅ©·Îµå¸¦ À§ÇÑ ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise) ¼ÒÇÁÆ®¿þ¾î Á¦Ç°±ºÀÌ Æ÷ÇԵȴÙ.
¿£ºñµð¾Æ H200Àº 2024³â 2ºÐ±âºÎÅÍ ±Û·Î¹ú ½Ã½ºÅÛ Á¦Á¶¾÷ü¿Í Ŭ¶ó¿ìµå ¼ºñ½º Á¦°ø¾÷ü¿¡¼ ±¸¸ÅÇÒ ¼ö ÀÖ´Ù. ¿£ºñµð¾Æ H200 ÅÙ¼ ÄÚ¾î GPU(H200 Tensor Core GPU)¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ ³»¿ëÀº 11¿ù 13ÀÏ ¿ÀÈÄ 11½Ã(Çѱ¹ ½Ã°£)¿¡ ÁøÇàµÇ´Â SC23 Ưº° ¿¬¼³¿¡¼ È®ÀÎÇÒ ¼ö ÀÖ´Ù. |