PC ´º½º Ȩ Àαâ PC ´º½º

¿£ºñµð¾Æ, ¸ðµç Ç÷§Æû¿¡¼­ ¸ÞŸ ¡®¶ó¸¶3¡¯ Ãß·Ð °¡¼ÓÈ­ Áö¿ø

2024-04-24 15:21
ÆíÁýºÎ press@bodnara.co.kr
AI ÄÄÇ»Æà ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ°¡ ¸ðµç Ç÷§Æû¿¡¼­ ¸ÞŸ(Meta)ÀÇ ÃֽŠ°Å´ë ¾ð¾î ¸ðµ¨(large language model, LLM)ÀÎ ¶ó¸¶3(Llama 3)¸¦ °¡¼ÓÈ­Çϱâ À§ÇÑ ÃÖÀûÈ­¸¦ ¹ßÇ¥Çß´Ù.



¿£ºñµð¾Æ(NVIDIA) °¡¼Ó ÄÄÇ»Æðú °áÇÕµÈ ÀÌ °³¹æÇü ¸ðµ¨Àº ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀ̼ǿ¡¼­ °³¹ßÀÚ¿Í ¿¬±¸¿ø ±×¸®°í ±â¾÷µéÀÇ ÁÖµµÀûÀÎ Çõ½ÅÀ» Áö¿øÇÒ ¿¹Á¤ÀÌ´Ù.

¿£ºñµð¾Æ AI·Î ÈÆ·Ã
¸ÞŸ ¿£Áö´Ï¾îµéÀº 24,576°³ÀÇ ¿£ºñµð¾Æ H100 ÅÙ¼­ ÄÚ¾î(Tensor Core) GPU°¡ žÀçµÇ°í, ¿£ºñµð¾Æ ÄöÅÒ-2 ÀÎÇǴϹêµå(Quantum-2 InfiniBand) ³×Æ®¿öÅ©¿Í ¿¬°áµÈ ÄÄÇ»ÅÍ Å¬·¯½ºÅÍ¿¡¼­ ¶ó¸¶3À» ÈÆ·ÃÇß´Ù. ¸ÞŸ´Â ¿£ºñµð¾ÆÀÇ Áö¿øÀ» ÅëÇØ ³×Æ®¿öÅ©, ¼ÒÇÁÆ®¿þ¾î, ¸ðµ¨ ¾ÆÅ°ÅØó¸¦ ÀÚ»çÀÇ ´ëÇ¥ LLM¿¡ ¸Â°Ô Á¶Á¤Çß´Ù.

¸ÞŸ´Â ÃÖ±Ù ¹ßÇ¥¿¡¼­ »ý¼ºÇü AIÀÇ ÃÖ÷´Ü ±â¼úÀ» ´õ¿í ¹ßÀü½ÃÅ°±â À§ÇØ ÀÎÇÁ¶ó¸¦ 350,000°³ÀÇ H100 GPU·Î È®ÀåÇÒ °èȹÀ̶ó°í ¹àÇû´Ù.

¶ó¸¶3 È°¿ëÇϱâ
¿£ºñµð¾Æ GPU¿¡¼­ °¡¼ÓÈ­µÈ ¶ó¸¶3°¡ Ŭ¶ó¿ìµå, µ¥ÀÌÅͼ¾ÅÍ, ¿§Áö ±×¸®°í PC¿¡¼­ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï Ãâ½ÃµÆ´Ù.

°³¹ßÀÚ´Â ºê¶ó¿ìÀú¿¡¼­ ai.nvidia.com¿¡ Á¢¼ÓÇØ ¶ó¸¶3¸¦ »ç¿ëÇØ º¼ ¼ö ÀÖ´Ù. ¶ó¸¶3´Â ¾îµð¼­³ª ¹èÆ÷µÉ ¼ö Àִ ǥÁØ ¾ÖÇø®ÄÉÀÌ¼Ç ÇÁ·Î±×·¡¹Ö ÀÎÅÍÆäÀ̽º¸¦ °®Ãá ¿£ºñµð¾Æ NIM ¸¶ÀÌÅ©·Î¼­ºñ½º·Î ÆÐŰ¡µÅ ÀÖ´Ù.

±â¾÷Àº º¸¾ÈÀÌ Áö¿øµÇ´Â ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise) Ç÷§ÆûÀÇ ÀϺÎÀÎ LLM¿ë ¿ÀÇ ¼Ò½º ÇÁ·¹ÀÓ¿öÅ© ¿£ºñµð¾Æ ³×¸ð(NeMo)¸¦ »ç¿ëÇØ µ¥ÀÌÅÍ·Î ¶ó¸¶3¸¦ ¹Ì¼¼ Á¶Á¤ÇÒ ¼ö ÀÖ´Ù. »ç¿ëÀÚ ÁöÁ¤ ¸ðµ¨Àº ¿£ºñµð¾Æ ÅÙ¼­RT-LLMÀ¸·Î Ã߷п¡ ÃÖÀûÈ­ÇÏ°í ¿£ºñµð¾Æ Æ®¸®Åæ Ãß·Ð ¼­¹ö(Triton Inference Server)·Î ¹èÆ÷ÇÒ ¼ö ÀÖ´Ù.

¶ó¸¶3¸¦ µð¹ÙÀ̽º¿Í PC¿¡¼­ »ç¿ëÇϱâ
¶ó¸¶3´Â ·Îº¸Æ½½º¿Í ¿§Áö ÄÄÇ»Æà µð¹ÙÀ̽º¸¦ À§ÇÑ ¿£ºñµð¾Æ Á¬½¼ ¿À¸°(Jetson Orin)¿¡¼­ ½ÇÇàµÇ¸ç, Á¬½¼ AI ·¦(AI Lab)¿¡¼­¿Í °°Àº ´ëÈ­Çü ¿¡ÀÌÀüÆ®¸¦ »ý¼ºÇÑ´Ù.

¶ÇÇÑ ¿öÅ©½ºÅ×À̼ǰú PC¿ë ¿£ºñµð¾Æ RTX¿Í ÁöÆ÷½º RTX(GeForce RTX) GPU´Â ¶ó¸¶3¿¡¼­ Ãß·Ð ¼Óµµ¸¦ ³ôÀδÙ. ÀÌ·¯ÇÑ ½Ã½ºÅÛÀ» ÅëÇØ °³¹ßÀÚ´Â Àü ¼¼°è 1¾ï °³ ÀÌ»óÀÇ ¿£ºñµð¾Æ °¡¼Ó ½Ã½ºÅÛÀ» È°¿ëÇÒ ¼ö ÀÖ´Ù.

¶ó¸¶3·Î ÃÖÀûÀÇ ¼º´É È®º¸Çϱâ
꺿¿ë LLMÀ» ¹èÆ÷Çϱâ À§Çؼ­´Â ªÀº Áö¿¬ ½Ã°£, ¿ì¼öÇÑ Àб⠼ӵµ, ºñ¿ë Àý°¨À» À§ÇÑ ÃÖÀûÀÇ GPU »ç¿ë °£ÀÇ ±ÕÇüÀ» °í·ÁÇØ¾ß ÇÑ´Ù.

ÀÌ·¯ÇÑ ¼­ºñ½º´Â ´Ü¾î ¼öÁØ¿¡ ÇØ´çÇÏ´Â ÅäÅ«À» ÃÊ´ç ¾à 10°³ÀÇ ÅäÅ«À» ó¸®ÇÏ´Â »ç¿ëÀÚÀÇ Àб⠼ӵµº¸´Ù ¾à 2¹è ºü¸¥ ¼Óµµ·Î Àü´ÞÇØ¾ß ÇÑ´Ù.

ÀÌ·¯ÇÑ ÃøÁ¤À» Àû¿ëÇÑ °á°ú, 700¾ï °³ÀÇ ¸Å°³º¯¼ö°¡ ÀÖ´Â ¶ó¸¶3À» »ç¿ëÇÑ Ãʱâ Å×½ºÆ®¿¡¼­ ´ÜÀÏ ¿£ºñµð¾Æ H200 ÅÙ¼­ ÄÚ¾î GPU´Â ÃÊ´ç ¾à 3,000°³ÀÇ ÅäÅ«À» »ý¼ºÇß´Ù. ÀÌ´Â ¾à 300¸íÀÇ µ¿½Ã »ç¿ëÀÚ¿¡°Ô ¼­ºñ½º¸¦ Á¦°øÇÒ ¼ö ÀÖ´Â ¾çÀÌ´Ù.

Áï, H200 GPU 8°³°¡ ÀåÂøµÈ ´ÜÀÏ ¿£ºñµð¾Æ HGX ¼­¹ö´Â ÃÊ´ç 24,000°³ÀÇ ÅäÅ«À» Àü¼ÛÇÒ ¼ö ÀÖÀ¸¸ç, µ¿½Ã¿¡ 2,400¸í ÀÌ»óÀÇ »ç¿ëÀÚ¸¦ Áö¿øÇÔÀ¸·Î½á ºñ¿ëÀ» ´õ¿í ÃÖÀûÈ­ÇÒ ¼ö ÀÖ´Ù.

¿§Áö µð¹ÙÀ̽ºÀÇ °æ¿ì, 80¾ï °³ÀÇ ¸Å°³º¯¼ö°¡ ÀÖ´Â ¶ó¸¶3´Â Á¬½¼ AGX ¿À¸°¿¡¼­ ÃÊ´ç ÃÖ´ë 40°³ÀÇ ÅäÅ«À», Á¬½¼ ¿À¸° ³ª³ë(Jetson Orin Nano)¿¡¼­ ÃÊ´ç 15°³ÀÇ ÅäÅ«À» »ý¼ºÇß´Ù.

Ä¿¹Â´ÏƼ ¸ðµ¨ °íµµÈ­
¿£ºñµð¾Æ´Â ¿ÀÇ ¼Ò½º¿¡ Àû±ØÀûÀ¸·Î ±â¿©ÇØ¿À°í ÀÖÀ¸¸ç, »ç¿ëÀÚ°¡ °¡Àå ¾î·Á¿î ¹®Á¦¸¦ ÇØ°áÇÏ´Â µ¥ À¯¿ëÇÑ Ä¿¹Â´ÏƼ ¼ÒÇÁÆ®¿þ¾î¸¦ ÃÖÀûÈ­ÇÏ´Â µ¥ Àü³äÇÏ°í ÀÖ´Ù. ¶ÇÇÑ ¿ÀÇ ¼Ò½º ¸ðµ¨Àº AI Åõ¸í¼ºÀ» ÃËÁøÇÏ°í »ç¿ëÀÚ°¡ AI ¾ÈÀü°ú º¹¿ø·Â¿¡ ´ëÇÑ ÀÛ¾÷À» ±¤¹üÀ§ÇÏ°Ô °øÀ¯ÇÒ ¼ö ÀÖµµ·Ï ÇÑ´Ù.

´Ð³×ÀÓ
ºñȸ¿ø

º¸µå³ª¶ó ¸¹ÀÌ º» ´º½º
º¸µå³ª¶ó ¸¹ÀÌ º» ±â»ç
·Î±×ÀÎ | ÀÌ ÆäÀÌÁöÀÇ PC¹öÀü
Copyright NexGen Research Corp. 2010