¿£ºñµð¾Æ°¡ ¿£ºñµð¾Æ ºí·¢À£(NVIDIA Blackwell) ¾ÆÅ°ÅØÃ³ ±â¹Ý AI Ç÷§ÆûÀ¸·Î ÃֽŠMLPerf ÈÆ·Ã(MLPerf Training) º¥Ä¡¸¶Å© Àü Ç׸ñ¿¡¼ ÃÖ°í ¼º´ÉÀ» ´Þ¼ºÇß´Ù°í ¹àÇû´Ù.
¿£ºñµð¾Æ´Â Àü ¼¼°è ±â¾÷µé°ú Çù·ÂÇØ AI ÆÑÅ丮¸¦ ±¸ÃàÇϰí ÀÖÀ¸¸ç, ÃÖ½Å ÈÆ·Ã, Ãß·Ð ±â¼úÀ» ±â¹ÝÀ¸·Î Â÷¼¼´ë AI ¾ÖÇø®ÄÉÀ̼ÇÀÇ ÈÆ·Ã°ú ¹èÆ÷ ¼Óµµ¸¦ ³ôÀ̰í ÀÖ´Ù.
¿£ºñµð¾Æ ºí·¢À£ ¾ÆÅ°ÅØÃ³´Â ÀÌ·¯ÇÑ »õ·Î¿î ¾ÖÇø®ÄÉÀ̼ÇÀÇ °íµµÈµÈ ¼º´É ¿ä±¸»çÇ×À» ÃæÁ·Çϵµ·Ï ¼³°èµÆ´Ù. 2018³â º¥Ä¡¸¶Å©°¡ µµÀÔµÈ ÀÌ·¡ 12¹øÂ°·Î ÁøÇàµÈ ÃֽŠMLPerf ÈÆ·Ã ¶ó¿îµå¿¡¼, ¿£ºñµð¾Æ AI Ç÷§ÆûÀº ¸ðµç º¥Ä¡¸¶Å© Ç׸ñ¿¡¼ ÃÖ°í ¼öÁØÀÇ ¼º´ÉÀ» ÀÔÁõÇß´Ù. ¶ÇÇÑ °¡Àå ±î´Ù·Î¿î °Å´ë ¾ð¾î ¸ðµ¨(large language model, LLM) Á᫐ Å×½ºÆ®ÀÎ ¶ó¸¶ 3.1 405B(Llama 3.1 405B) »çÀü ÈÆ·Ã¿¡¼ Á¦ÃâµÈ ¸ðµç °á°úµµ ¿£ºñµð¾Æ Ç÷§Æû À§¿¡¼ ½ÇÇàµÆ´Ù.
¿£ºñµð¾Æ Ç÷§ÆûÀº À¯ÀÏÇÏ°Ô MLPerf ÈÆ·Ã v5.0ÀÇ ¸ðµç º¥Ä¡¸¶Å© Ç׸ñ¿¡ °á°ú¸¦ Á¦ÃâÇß´Ù. ¿£ºñµð¾Æ´Â LLM, Ãßõ ½Ã½ºÅÛ, ¸ÖƼ¸ð´Þ LLM, °´Ã¼ °¨Áö, ±×·¡ÇÁ ½Å°æ¸ÁÀ» ¾Æ¿ì¸£´Â ±¤¹üÀ§ÇÑ AI ¿öÅ©·Îµå¿¡¼ Ź¿ùÇÑ ¼º´É°ú ¹ü¿ë¼ºÀ» ÀÔÁõÇß´Ù.
´ë±Ô¸ð Ãâǰ¿¡´Â ¿£ºñµð¾Æ ºí·¢À£ Ç÷§ÆûÀ¸·Î ±¸µ¿µÇ´Â µÎ ´ëÀÇ AI ½´ÆÛÄÄÇ»ÅͰ¡ »ç¿ëµÆ´Ù. ÀÌ´Â °¢°¢ ¿£ºñµð¾Æ GB200 NVL72 ·¢ ½ºÄÉÀÏ ½Ã½ºÅÛÀ¸·Î ±¸¼ºµÈ ƼÄÉ(Tyche), ¿£ºñµð¾Æ DGX B200 ½Ã½ºÅÛÀ» ±â¹ÝÀ¸·Î ÇÑ ´Ð½º(Nyx)ÀÌ´Ù. ¶ÇÇÑ ¿£ºñµð¾Æ´Â ÄÚ¾îÀ§ºê(CoreWeave), IBM°ú Çù·ÂÇØ ÃÑ 2,496°³ÀÇ ºí·¢À£ GPU¿Í 1,248°³ÀÇ ¿£ºñµð¾Æ ±×·¹À̽º(Grace) CPU¸¦ »ç¿ëÇÑ GB200 NVL72 °á°úµµ Á¦ÃâÇß´Ù.
»õ·Î¿î ¶ó¸¶ 3.1 405B »çÀü ÈÆ·Ã º¥Ä¡¸¶Å©¿¡¼ ºí·¢À£ ¾ÆÅ°ÅØÃ³´Â µ¿ÀÏÇÑ ±Ô¸ðÀÇ ÀÌÀü ¼¼´ë ´ëºñ 2.2¹è Çâ»óµÈ ¼º´ÉÀ» ±â·ÏÇß´Ù.
¶ó¸¶ 2 70B LoRA ¹Ì¼¼ Á¶Á¤ º¥Ä¡¸¶Å©¿¡¼´Â ºí·¢À£ GPU 8°³°¡ žÀçµÈ ¿£ºñµð¾Æ DGX B200 ½Ã½ºÅÛÀÌ ÀÌÀü ¶ó¿îµå¿¡¼ µ¿ÀÏ GPU ¼ö·Î Á¦ÃâÇÑ °á°úº¸´Ù 2.5¹è ´õ ³ôÀº ¼º´ÉÀ» ´Þ¼ºÇß´Ù.
ÀÌ·¯ÇÑ ¼º´É µµ¾àÀº ºí·¢À£ ¾ÆÅ°ÅØÃ³ÀÇ ±â¼úÀû Áøº¸¸¦ Àß º¸¿©ÁØ´Ù. ¿©±â¿¡´Â °í¹Ðµµ ¼ö·©½Ä ·¢, ·¢´ç 13.4 Å×¶ó¹ÙÀÌÆ®(TB)ÀÇ ÄÚÈ÷¾î·±Æ® ¸Þ¸ð¸®, ½ºÄÉÀϾ÷(scale-up)À» À§ÇÑ 5¼¼´ë ¿£ºñµð¾Æ NV¸µÅ©(NVLink)¿Í ¿£ºñµð¾Æ NV¸µÅ© ½ºÀ§Ä¡(Switch) »óÈ£¿¬°á ±â¼ú, ±×¸®°í ½ºÄÉÀÏ ¾Æ¿ô(scale-out)À» À§ÇÑ ¿£ºñµð¾Æ ÄöÅÒ-2 ÀÎÇǴϹêµå(Quantum-2 InfiniBand) ³×Æ®¿öÅ· µîÀÌ Æ÷ÇԵȴÙ. ¶ÇÇÑ ¿£ºñµð¾Æ ³×¸ð ÇÁ·¹ÀÓ¿öÅ©(NeMo Framework) ¼ÒÇÁÆ®¿þ¾î ½ºÅÃÀÇ Çõ½ÅÀº ¿¡ÀÌÀüƽ AI ¾ÖÇø®ÄÉÀÌ¼Ç ½ÇÇö¿¡ ÇÙ½ÉÀûÀÎ ±â¹ÝÀÌ µÇ´Â Â÷¼¼´ë ¸ÖƼ¸ð´Þ LLM ÈÆ·ÃÀÇ ±âÁØÀ» ³ô¿´´Ù.
ÀÌ·¯ÇÑ ¿¡ÀÌÀüƽ AI ±â¹Ý ¾ÖÇø®ÄÉÀ̼ÇÀº ¹Ì·¡ÀÇ AI ÆÑÅ丮¿¡¼ ÀÛµ¿ÇÏ°Ô µÇ¸ç, ÀÌ´Â °ð ¿¡ÀÌÀüƽ AI °æÁ¦ÀÇ ÇÙ½É ¿£ÁøÀ¸·Î ÀÚ¸®ÀâÀ» Àü¸ÁÀÌ´Ù. ÀÌ·¯ÇÑ »õ·Î¿î ¾ÖÇø®ÄÉÀ̼ÇÀº ÅäÅ«°ú Áö´É Á¤º¸¸¦ »ý¼ºÇϸç, °ÅÀÇ ¸ðµç »ê¾÷°ú Çй® ºÐ¾ß¿¡ °ÉÃÄ °¡Ä¡¸¦ âÃâÇÒ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ µ¥ÀÌÅͼ¾ÅÍ Ç÷§Æû¿¡´Â GPU, CPU, °í¼Ó ÆÐºê¸¯, ³×Æ®¿öÅ·Àº ¹°·Ð ¿£ºñµð¾Æ Äí´Ù-X(CUDA-X) ¶óÀ̺귯¸®, ³×¸ð ÇÁ·¹ÀÓ¿öÅ©, ¿£ºñµð¾Æ ÅÙ¼RT-LLM(TensorRT-LLM), ¿£ºñµð¾Æ ´ÙÀ̳ª¸ð(Dynamo)¿Í °°Àº ¹æ´ëÇÑ ¼ÒÇÁÆ®¿þ¾î°¡ Æ÷ÇԵȴÙ. ÀÌó·³ Á¤¹ÐÇÑ Çϵå¿þ¾î¿Í ¼ÒÇÁÆ®¿þ¾î ±â¼ú Á¶ÇÕÀº Á¶Á÷ÀÌ AI ¸ðµ¨À» ´õ ºü¸£°Ô ÈÆ·ÃÇÏ°í ¹èÆ÷ÇÒ ¼ö ÀÖ°Ô ÇØ °¡Ä¡ ½ÇÇö ½Ã°£À» ȹ±âÀûÀ¸·Î ´ÜÃà½ÃŲ´Ù.
À̹ø MLPerf ¶ó¿îµå¿¡´Â ÄÚ¾îÀ§ºê¿Í IBM ¿Ü¿¡µµ ´Ù¾çÇÑ ¿£ºñµð¾Æ ÆÄÆ®³Ê»çµéÀÌ Âü¿©Çß´Ù. ¿¡À̼ö½º(ASUS), ½Ã½ºÄÚ(Cisco), µ¨ Å×Å©³î·ÎÁö½º(Dell Technologies), ±â°¡ÄÄÇ»ÆÃ(Giga Computing), ±¸±Û Ŭ¶ó¿ìµå(Google Cloud), ÈÞ·¿ÆÑÄ¿µå ¿£ÅÍÇÁ¶óÀÌÁî(Hewlett Packard Enterprise, HPE), ¶÷´Ù(Lambda), ·¹³ë¹ö(Lenovo), ³×ºñ¿ì½º(Nebius), ¿À¶óŬ Ŭ¶ó¿ìµå ÀÎÇÁ¶ó½ºÆ®·°Ã³(Oracle Cloud Infrastructure, OCI), ÄöŸ Ŭ¶ó¿ìµå Å×Å©³î·ÎÁö(Quanta Cloud Technology), ½´ÆÛ¸¶ÀÌÅ©·Î(Supermicro) µîÀÌ ´Ù¾çÇÑ º¥Ä¡¸¶Å© °á°ú¸¦ Á¦ÃâÇß´Ù.
|