PC ´º½º Ȩ Àαâ PC ´º½º

¿£ºñµð¾Æ, ±¸±Û°ú Çù·ÂÇØ AI ¸ðµ¨ Áª¸¶ ÃÖÀûÈ­

2024-02-23 09:58
ÆíÁýºÎ press@bodnara.co.kr

¿£ºñµð¾Æ°¡ ±¸±Û(Google)°ú Çù·ÂÇØ ¸ðµç ¿£ºñµð¾Æ(NVIDIA) AI Ç÷§Æû¿¡¼­ AI ¸ðµ¨ Áª¸¶(Gemma)¸¦ À§ÇÑ ÃÖÀûÈ­¸¦ ½Ç½ÃÇß´Ù°í ¹àÇû´Ù. À̸¦ ÅëÇØ ºñ¿ëÀ» Àý°¨ÇÏ°í µµ¸ÞÀκ° ¿ëµµ¿¡ µû¶ó ÀÛ¾÷ ¼Óµµ¸¦ Çõ½ÅÀûÀ¸·Î ³ô¿´´Ù.

 

¾îµð¼­³ª ½ÇÇà °¡´ÉÇÑ Áª¸¶´Â ±¸±ÛÀÇ »õ·Î¿î °æ·® ¿ÀÇ ¾ð¾î ¸ðµ¨·Î, 20¾ï(2B) ÆĶó¹ÌÅÍ¿Í 70¾ï(7B) ÆĶó¹ÌÅÍ Å©±â·Î Á¦°øµÈ´Ù.

Áª¸¶´Â ±¸±ÛÀÇ ¸ÖƼ¸ð´Þ ¸ðµ¨ÀÎ Á¦¹Ì³ªÀÌ(Gemini) °³¹ß¿¡ »ç¿ëµÈ µ¿ÀÏÇÑ ¿¬±¸¿Í ±â¼úÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÆ´Ù. ¿£ºñµð¾Æ´Â ±¸±Û°ú ±ä¹ÐÈ÷ Çù·ÂÇØ ¿£ºñµð¾Æ ÅÙ¼­RT-LLM(TensorRT-LLM)À¸·Î Áª¸¶ÀÇ ¼º´ÉÀ» °¡¼ÓÈ­Çß´Ù. ÅÙ¼­RT-LLMÀº µ¥ÀÌÅͼ¾ÅÍ, Ŭ¶ó¿ìµå ȤÀº ¿£ºñµð¾Æ RTX GPU°¡ žÀçµÈ PC¿¡¼­ ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM) Ãß·ÐÀ» ÃÖÀûÈ­ÇÏ´Â ¿ÀÇ ¼Ò½º ¶óÀ̺귯¸®ÀÌ´Ù.

À̸¦ ÅëÇØ °³¹ßÀÚ´Â Àü ¼¼°è °í¼º´É AI PC¿¡ žÀçµÈ 1¾ï °³ ÀÌ»óÀÇ ¿£ºñµð¾Æ RTX GPU¸¦ È°¿ëÇÒ ¼ö ÀÖ´Ù.

°³¹ßÀÚµéÀº Ŭ¶ó¿ìµå »óÀÇ ¿£ºñµð¾Æ GPU¿¡¼­µµ Áª¸¶¸¦ ½ÇÇàÇÒ ¼ö ÀÖ´Ù. ¿©±â¿¡´Â H100 ÅÙ¼­ ÄÚ¾î(H100 Tensor Core) GPU¸¦ ±â¹ÝÀ¸·Î ÇÏ´Â ±¸±Û Ŭ¶ó¿ìµå A3ÀνºÅϽº(A3 instances)°¡ Æ÷ÇԵǸç, ÃÊ´ç 4.8Å׶ó¹ÙÀÌÆ®ÀÇ 141GB HBM3e ¸Þ¸ð¸®¸¦ °®Ãá ¿£ºñµð¾Æ H200 ÅÙ¼­ ÄÚ¾î GPUµµ ÇÕ·ùÇÒ ¿¹Á¤ÀÌ´Ù. ±¸±ÛÀº ¿ÃÇØ ¾È¿¡ À̸¦ ¹èÆ÷ÇÒ ¿¹Á¤À̶ó°í ÀüÇß´Ù.

¿£ºñµð¾Æ´Â ³×¸ð ÇÁ·¹ÀÓ¿öÅ©(NeMo Framework)°¡ Àû¿ëµÈ ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise)¿Í ÅÙ¼­RT-LLMÀ» ºñ·ÔÇÑ ±¤¹üÀ§ÇÑ µµ±¸¸¦ °®Ãß°í ÀÖ´Ù. ¿£ÅÍÇÁ¶óÀÌÁî °³¹ßÀÚµéÀº À̵éÀ» Ãß°¡·Î È°¿ëÇØ Áª¸¶¸¦ ¹Ì¼¼ Á¶Á¤ÇÏ°í ÃÖÀûÈ­µÈ ¸ðµ¨À» ÇÁ·Î´ö¼Ç ¾ÖÇø®ÄÉÀ̼ǿ¡ ¹èÆ÷ÇÒ ¼ö ÀÖ´Ù.

¿©±â¿¡¼­ °³¹ßÀÚ¸¦ À§ÇÑ Ãß°¡ Á¤º¸¿Í ÇÔ²² ÅÙ¼­RT-LLMÀÌ Áª¸¶ÀÇ Ãß·ÐÀ» °³¼±ÇÏ´Â ¹æ¹ý¿¡ ´ëÇØ ÀÚ¼¼È÷ ¾Ë¾Æº¼ ¼ö ÀÖ´Ù. ¿©±â¿¡´Â Áª¸¶ÀÇ ¿©·¯ ¸ðµ¨ üũÆ÷ÀÎÆ®¿Í FP8 Á¤·®È­ ¹öÀü ¸ðµ¨ÀÌ Æ÷ÇÔµÇ¸ç ¸ðµÎ ÅÙ¼­RT-LLMÀ¸·Î ÃÖÀûÈ­µÅ ÀÖ´Ù.

¶ÇÇÑ, ¿£ºñµð¾Æ AI Ç÷¹À̱׶ó¿îµå(AI Playground)¸¦ ÅëÇØ ºê¶ó¿ìÀú¿¡¼­ Á÷Á¢ Áª¸¶ 2B¿Í Áª¸¶ 7B¸¦ üÇèÇØ º¼ ¼ö ÀÖ´Ù.

¿£ºñµð¾Æ ±â¼ú µ¥¸ðÀΠê À§µå RTX¿¡ °ð Áª¸¶°¡ Ãß°¡·Î Áö¿øµÉ ¿¹Á¤ÀÌ´Ù. ê À§µå RTX´Â °Ë»ö Áõ°­ »ý¼º(Retrieval-augmented generation, RAG)°ú ÅÙ¼­RT-LLM ¼ÒÇÁÆ®¿þ¾î¸¦ »ç¿ëÇØ ·ÎÄà RTX ±â¹Ý À©µµ¿ì(Windows) PC¿¡¼­ »ç¿ëÀÚ¿¡°Ô »ý¼ºÇü AI ±â´ÉÀ» Á¦°øÇÏ´Â ±â¼úÀÌ´Ù.

»ç¿ëÀڴ ê À§µå RTX¸¦ ÅëÇØ PCÀÇ ·ÎÄà ÆÄÀÏÀ» LLM¿¡ ½±°Ô ¿¬°áÇÏ°í ÀÚ½ÅÀÇ µ¥ÀÌÅͷΠ꺿À» °³ÀÎÈ­ ÇÒ ¼ö ÀÖ´Ù.

ê À§µå RTX´Â ·ÎÄÿ¡¼­ ¸ðµ¨ÀÌ ½ÇÇàµÇ¹Ç·Î °á°ú°¡ ºü¸£°Ô Á¦°øµÇ¸ç »ç¿ëÀÚ µ¥ÀÌÅÍ°¡ µð¹ÙÀ̽º¿¡ À¯ÁöµÈ´Ù. Ŭ¶ó¿ìµå ±â¹Ý LLM ¼­ºñ½º¿¡ ´ë½Å ê À§µå RTX¸¦ »ç¿ëÇÏ¸é ¹Î°¨ÇÑ µ¥ÀÌÅ͸¦ Á¦3ÀÚ¿Í °øÀ¯Çϰųª ÀÎÅͳݿ¡ ¿¬°áÇÒ ÇÊ¿ä ¾øÀÌ ·ÎÄà PC¿¡¼­ ó¸®ÇÒ ¼ö ÀÖ´Ù.

´Ð³×ÀÓ
ºñȸ¿ø

º¸µå³ª¶ó ¸¹ÀÌ º» ´º½º
º¸µå³ª¶ó ¸¹ÀÌ º» ±â»ç
·Î±×ÀÎ | ÀÌ ÆäÀÌÁöÀÇ PC¹öÀü
Copyright NexGen Research Corp. 2010