AI ÄÄÇ»Æà ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ°¡ ¸ðµç Ç÷§Æû¿¡¼ ¸ÞŸ(Meta)ÀÇ ÃֽŠ°Å´ë ¾ð¾î ¸ðµ¨(large language model, LLM)ÀÎ ¶ó¸¶3(Llama 3)¸¦ °¡¼ÓÈÇϱâ À§ÇÑ ÃÖÀûȸ¦ ¹ßÇ¥Çß´Ù.
¿£ºñµð¾Æ(NVIDIA) °¡¼Ó ÄÄÇ»Æðú °áÇÕµÈ ÀÌ °³¹æÇü ¸ðµ¨Àº ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀ̼ǿ¡¼ °³¹ßÀÚ¿Í ¿¬±¸¿ø ±×¸®°í ±â¾÷µéÀÇ ÁÖµµÀûÀÎ Çõ½ÅÀ» Áö¿øÇÒ ¿¹Á¤ÀÌ´Ù.
¿£ºñµð¾Æ AI·Î ÈÆ·Ã
¸ÞŸ ¿£Áö´Ï¾îµéÀº 24,576°³ÀÇ ¿£ºñµð¾Æ H100 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU°¡ žÀçµÇ°í, ¿£ºñµð¾Æ ÄöÅÒ-2 ÀÎÇǴϹêµå(Quantum-2 InfiniBand) ³×Æ®¿öÅ©¿Í ¿¬°áµÈ ÄÄÇ»ÅÍ Å¬·¯½ºÅÍ¿¡¼ ¶ó¸¶3À» ÈÆ·ÃÇß´Ù. ¸ÞŸ´Â ¿£ºñµð¾ÆÀÇ Áö¿øÀ» ÅëÇØ ³×Æ®¿öÅ©, ¼ÒÇÁÆ®¿þ¾î, ¸ðµ¨ ¾ÆÅ°ÅØó¸¦ ÀÚ»çÀÇ ´ëÇ¥ LLM¿¡ ¸Â°Ô Á¶Á¤Çß´Ù.
¸ÞŸ´Â ÃÖ±Ù ¹ßÇ¥¿¡¼ »ý¼ºÇü AIÀÇ ÃÖ÷´Ü ±â¼úÀ» ´õ¿í ¹ßÀü½ÃÅ°±â À§ÇØ ÀÎÇÁ¶ó¸¦ 350,000°³ÀÇ H100 GPU·Î È®ÀåÇÒ °èȹÀ̶ó°í ¹àÇû´Ù.
¶ó¸¶3 È°¿ëÇϱâ
¿£ºñµð¾Æ GPU¿¡¼ °¡¼ÓÈµÈ ¶ó¸¶3°¡ Ŭ¶ó¿ìµå, µ¥ÀÌÅͼ¾ÅÍ, ¿§Áö ±×¸®°í PC¿¡¼ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï Ãâ½ÃµÆ´Ù.
°³¹ßÀÚ´Â ºê¶ó¿ìÀú¿¡¼ ai.nvidia.com¿¡ Á¢¼ÓÇØ ¶ó¸¶3¸¦ »ç¿ëÇØ º¼ ¼ö ÀÖ´Ù. ¶ó¸¶3´Â ¾îµð¼³ª ¹èÆ÷µÉ ¼ö Àִ ǥÁØ ¾ÖÇø®ÄÉÀÌ¼Ç ÇÁ·Î±×·¡¹Ö ÀÎÅÍÆäÀ̽º¸¦ °®Ãá ¿£ºñµð¾Æ NIM ¸¶ÀÌÅ©·Î¼ºñ½º·Î ÆÐŰ¡µÅ ÀÖ´Ù.
±â¾÷Àº º¸¾ÈÀÌ Áö¿øµÇ´Â ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise) Ç÷§ÆûÀÇ ÀϺÎÀÎ LLM¿ë ¿ÀÇ ¼Ò½º ÇÁ·¹ÀÓ¿öÅ© ¿£ºñµð¾Æ ³×¸ð(NeMo)¸¦ »ç¿ëÇØ µ¥ÀÌÅÍ·Î ¶ó¸¶3¸¦ ¹Ì¼¼ Á¶Á¤ÇÒ ¼ö ÀÖ´Ù. »ç¿ëÀÚ ÁöÁ¤ ¸ðµ¨Àº ¿£ºñµð¾Æ ÅÙ¼RT-LLMÀ¸·Î Ã߷п¡ ÃÖÀûÈÇÏ°í ¿£ºñµð¾Æ Æ®¸®Åæ Ãß·Ð ¼¹ö(Triton Inference Server)·Î ¹èÆ÷ÇÒ ¼ö ÀÖ´Ù.
¶ó¸¶3¸¦ µð¹ÙÀ̽º¿Í PC¿¡¼ »ç¿ëÇϱâ
¶ó¸¶3´Â ·Îº¸Æ½½º¿Í ¿§Áö ÄÄÇ»Æà µð¹ÙÀ̽º¸¦ À§ÇÑ ¿£ºñµð¾Æ Á¬½¼ ¿À¸°(Jetson Orin)¿¡¼ ½ÇÇàµÇ¸ç, Á¬½¼ AI ·¦(AI Lab)¿¡¼¿Í °°Àº ´ëÈÇü ¿¡ÀÌÀüÆ®¸¦ »ý¼ºÇÑ´Ù.
¶ÇÇÑ ¿öÅ©½ºÅ×À̼ǰú PC¿ë ¿£ºñµð¾Æ RTX¿Í ÁöÆ÷½º RTX(GeForce RTX) GPU´Â ¶ó¸¶3¿¡¼ Ãß·Ð ¼Óµµ¸¦ ³ôÀδÙ. ÀÌ·¯ÇÑ ½Ã½ºÅÛÀ» ÅëÇØ °³¹ßÀÚ´Â Àü ¼¼°è 1¾ï °³ ÀÌ»óÀÇ ¿£ºñµð¾Æ °¡¼Ó ½Ã½ºÅÛÀ» È°¿ëÇÒ ¼ö ÀÖ´Ù.
¶ó¸¶3·Î ÃÖÀûÀÇ ¼º´É È®º¸Çϱâ
꺿¿ë LLMÀ» ¹èÆ÷Çϱâ À§Çؼ´Â ªÀº Áö¿¬ ½Ã°£, ¿ì¼öÇÑ Àб⠼ӵµ, ºñ¿ë Àý°¨À» À§ÇÑ ÃÖÀûÀÇ GPU »ç¿ë °£ÀÇ ±ÕÇüÀ» °í·ÁÇØ¾ß ÇÑ´Ù.
ÀÌ·¯ÇÑ ¼ºñ½º´Â ´Ü¾î ¼öÁØ¿¡ ÇØ´çÇÏ´Â ÅäÅ«À» ÃÊ´ç ¾à 10°³ÀÇ ÅäÅ«À» ó¸®ÇÏ´Â »ç¿ëÀÚÀÇ Àб⠼ӵµº¸´Ù ¾à 2¹è ºü¸¥ ¼Óµµ·Î Àü´ÞÇØ¾ß ÇÑ´Ù.
ÀÌ·¯ÇÑ ÃøÁ¤À» Àû¿ëÇÑ °á°ú, 700¾ï °³ÀÇ ¸Å°³º¯¼ö°¡ ÀÖ´Â ¶ó¸¶3À» »ç¿ëÇÑ Ãʱâ Å×½ºÆ®¿¡¼ ´ÜÀÏ ¿£ºñµð¾Æ H200 ÅÙ¼ ÄÚ¾î GPU´Â ÃÊ´ç ¾à 3,000°³ÀÇ ÅäÅ«À» »ý¼ºÇß´Ù. ÀÌ´Â ¾à 300¸íÀÇ µ¿½Ã »ç¿ëÀÚ¿¡°Ô ¼ºñ½º¸¦ Á¦°øÇÒ ¼ö ÀÖ´Â ¾çÀÌ´Ù.
Áï, H200 GPU 8°³°¡ ÀåÂøµÈ ´ÜÀÏ ¿£ºñµð¾Æ HGX ¼¹ö´Â ÃÊ´ç 24,000°³ÀÇ ÅäÅ«À» Àü¼ÛÇÒ ¼ö ÀÖÀ¸¸ç, µ¿½Ã¿¡ 2,400¸í ÀÌ»óÀÇ »ç¿ëÀÚ¸¦ Áö¿øÇÔÀ¸·Î½á ºñ¿ëÀ» ´õ¿í ÃÖÀûÈÇÒ ¼ö ÀÖ´Ù.
¿§Áö µð¹ÙÀ̽ºÀÇ °æ¿ì, 80¾ï °³ÀÇ ¸Å°³º¯¼ö°¡ ÀÖ´Â ¶ó¸¶3´Â Á¬½¼ AGX ¿À¸°¿¡¼ ÃÊ´ç ÃÖ´ë 40°³ÀÇ ÅäÅ«À», Á¬½¼ ¿À¸° ³ª³ë(Jetson Orin Nano)¿¡¼ ÃÊ´ç 15°³ÀÇ ÅäÅ«À» »ý¼ºÇß´Ù.
Ä¿¹Â´ÏƼ ¸ðµ¨ °íµµÈ
¿£ºñµð¾Æ´Â ¿ÀÇ ¼Ò½º¿¡ Àû±ØÀûÀ¸·Î ±â¿©ÇØ¿À°í ÀÖÀ¸¸ç, »ç¿ëÀÚ°¡ °¡Àå ¾î·Á¿î ¹®Á¦¸¦ ÇØ°áÇÏ´Â µ¥ À¯¿ëÇÑ Ä¿¹Â´ÏƼ ¼ÒÇÁÆ®¿þ¾î¸¦ ÃÖÀûÈÇÏ´Â µ¥ Àü³äÇÏ°í ÀÖ´Ù. ¶ÇÇÑ ¿ÀÇ ¼Ò½º ¸ðµ¨Àº AI Åõ¸í¼ºÀ» ÃËÁøÇÏ°í »ç¿ëÀÚ°¡ AI ¾ÈÀü°ú º¹¿ø·Â¿¡ ´ëÇÑ ÀÛ¾÷À» ±¤¹üÀ§ÇÏ°Ô °øÀ¯ÇÒ ¼ö ÀÖµµ·Ï ÇÑ´Ù.
|