¿£ºñµð¾Æ°¡ ±¸±Û(Google)°ú Çù·ÂÇØ ¸ðµç ¿£ºñµð¾Æ(NVIDIA) AI Ç÷§Æû¿¡¼ AI ¸ðµ¨ Áª¸¶(Gemma)¸¦ À§ÇÑ ÃÖÀûȸ¦ ½Ç½ÃÇß´Ù°í ¹àÇû´Ù. À̸¦ ÅëÇØ ºñ¿ëÀ» Àý°¨ÇÏ°í µµ¸ÞÀκ° ¿ëµµ¿¡ µû¶ó ÀÛ¾÷ ¼Óµµ¸¦ Çõ½ÅÀûÀ¸·Î ³ô¿´´Ù.
¾îµð¼³ª ½ÇÇà °¡´ÉÇÑ Áª¸¶´Â ±¸±ÛÀÇ »õ·Î¿î °æ·® ¿ÀÇ ¾ð¾î ¸ðµ¨·Î, 20¾ï(2B) ÆĶó¹ÌÅÍ¿Í 70¾ï(7B) ÆĶó¹ÌÅÍ Å©±â·Î Á¦°øµÈ´Ù.
Áª¸¶´Â ±¸±ÛÀÇ ¸ÖƼ¸ð´Þ ¸ðµ¨ÀÎ Á¦¹Ì³ªÀÌ(Gemini) °³¹ß¿¡ »ç¿ëµÈ µ¿ÀÏÇÑ ¿¬±¸¿Í ±â¼úÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÆ´Ù. ¿£ºñµð¾Æ´Â ±¸±Û°ú ±ä¹ÐÈ÷ Çù·ÂÇØ ¿£ºñµð¾Æ ÅÙ¼RT-LLM(TensorRT-LLM)À¸·Î Áª¸¶ÀÇ ¼º´ÉÀ» °¡¼ÓÈÇß´Ù. ÅÙ¼RT-LLMÀº µ¥ÀÌÅͼ¾ÅÍ, Ŭ¶ó¿ìµå ȤÀº ¿£ºñµð¾Æ RTX GPU°¡ žÀçµÈ PC¿¡¼ ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM) Ãß·ÐÀ» ÃÖÀûÈÇÏ´Â ¿ÀÇ ¼Ò½º ¶óÀ̺귯¸®ÀÌ´Ù.
À̸¦ ÅëÇØ °³¹ßÀÚ´Â Àü ¼¼°è °í¼º´É AI PC¿¡ žÀçµÈ 1¾ï °³ ÀÌ»óÀÇ ¿£ºñµð¾Æ RTX GPU¸¦ È°¿ëÇÒ ¼ö ÀÖ´Ù.
°³¹ßÀÚµéÀº Ŭ¶ó¿ìµå »óÀÇ ¿£ºñµð¾Æ GPU¿¡¼µµ Áª¸¶¸¦ ½ÇÇàÇÒ ¼ö ÀÖ´Ù. ¿©±â¿¡´Â H100 ÅÙ¼ ÄÚ¾î(H100 Tensor Core) GPU¸¦ ±â¹ÝÀ¸·Î ÇÏ´Â ±¸±Û Ŭ¶ó¿ìµå A3ÀνºÅϽº(A3 instances)°¡ Æ÷ÇԵǸç, ÃÊ´ç 4.8Å׶ó¹ÙÀÌÆ®ÀÇ 141GB HBM3e ¸Þ¸ð¸®¸¦ °®Ãá ¿£ºñµð¾Æ H200 ÅÙ¼ ÄÚ¾î GPUµµ ÇÕ·ùÇÒ ¿¹Á¤ÀÌ´Ù. ±¸±ÛÀº ¿ÃÇØ ¾È¿¡ À̸¦ ¹èÆ÷ÇÒ ¿¹Á¤À̶ó°í ÀüÇß´Ù.
¿£ºñµð¾Æ´Â ³×¸ð ÇÁ·¹ÀÓ¿öÅ©(NeMo Framework)°¡ Àû¿ëµÈ ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise)¿Í ÅÙ¼RT-LLMÀ» ºñ·ÔÇÑ ±¤¹üÀ§ÇÑ µµ±¸¸¦ °®Ãß°í ÀÖ´Ù. ¿£ÅÍÇÁ¶óÀÌÁî °³¹ßÀÚµéÀº À̵éÀ» Ãß°¡·Î È°¿ëÇØ Áª¸¶¸¦ ¹Ì¼¼ Á¶Á¤ÇÏ°í ÃÖÀûÈµÈ ¸ðµ¨À» ÇÁ·Î´ö¼Ç ¾ÖÇø®ÄÉÀ̼ǿ¡ ¹èÆ÷ÇÒ ¼ö ÀÖ´Ù.
¿©±â¿¡¼ °³¹ßÀÚ¸¦ À§ÇÑ Ãß°¡ Á¤º¸¿Í ÇÔ²² ÅÙ¼RT-LLMÀÌ Áª¸¶ÀÇ Ãß·ÐÀ» °³¼±ÇÏ´Â ¹æ¹ý¿¡ ´ëÇØ ÀÚ¼¼È÷ ¾Ë¾Æº¼ ¼ö ÀÖ´Ù. ¿©±â¿¡´Â Áª¸¶ÀÇ ¿©·¯ ¸ðµ¨ üũÆ÷ÀÎÆ®¿Í FP8 Á¤·®È ¹öÀü ¸ðµ¨ÀÌ Æ÷ÇÔµÇ¸ç ¸ðµÎ ÅÙ¼RT-LLMÀ¸·Î ÃÖÀûȵŠÀÖ´Ù.
¶ÇÇÑ, ¿£ºñµð¾Æ AI Ç÷¹À̱׶ó¿îµå(AI Playground)¸¦ ÅëÇØ ºê¶ó¿ìÀú¿¡¼ Á÷Á¢ Áª¸¶ 2B¿Í Áª¸¶ 7B¸¦ üÇèÇØ º¼ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ ±â¼ú µ¥¸ðÀΠê À§µå RTX¿¡ °ð Áª¸¶°¡ Ãß°¡·Î Áö¿øµÉ ¿¹Á¤ÀÌ´Ù. ê À§µå RTX´Â °Ë»ö Áõ° »ý¼º(Retrieval-augmented generation, RAG)°ú ÅÙ¼RT-LLM ¼ÒÇÁÆ®¿þ¾î¸¦ »ç¿ëÇØ ·ÎÄà RTX ±â¹Ý À©µµ¿ì(Windows) PC¿¡¼ »ç¿ëÀÚ¿¡°Ô »ý¼ºÇü AI ±â´ÉÀ» Á¦°øÇÏ´Â ±â¼úÀÌ´Ù.
»ç¿ëÀڴ ê À§µå RTX¸¦ ÅëÇØ PCÀÇ ·ÎÄà ÆÄÀÏÀ» LLM¿¡ ½±°Ô ¿¬°áÇÏ°í ÀÚ½ÅÀÇ µ¥ÀÌÅͷΠ꺿À» °³ÀÎÈ ÇÒ ¼ö ÀÖ´Ù.
ê À§µå RTX´Â ·ÎÄÿ¡¼ ¸ðµ¨ÀÌ ½ÇÇàµÇ¹Ç·Î °á°ú°¡ ºü¸£°Ô Á¦°øµÇ¸ç »ç¿ëÀÚ µ¥ÀÌÅÍ°¡ µð¹ÙÀ̽º¿¡ À¯ÁöµÈ´Ù. Ŭ¶ó¿ìµå ±â¹Ý LLM ¼ºñ½º¿¡ ´ë½Å ê À§µå RTX¸¦ »ç¿ëÇÏ¸é ¹Î°¨ÇÑ µ¥ÀÌÅ͸¦ Á¦3ÀÚ¿Í °øÀ¯Çϰųª ÀÎÅͳݿ¡ ¿¬°áÇÒ ÇÊ¿ä ¾øÀÌ ·ÎÄà PC¿¡¼ ó¸®ÇÒ ¼ö ÀÖ´Ù.
|