¿£ºñµð¾Æ°¡ Èùµð¾î¸¦ À§ÇÑ ¼ÒÇü ¾ð¾î ¸ðµ¨(small Language Model, sLM)ÀÎ ³×¸ðÆ®·Ð-4-¹Ì´Ï-Èùµð-4B(Nemotron-4-Mini-Hindi-4B)¸¦ Ãâ½ÃÇØ Àεµ¿¡¼ ¸ÂÃãÇü ¾ð¾î ¸ðµ¨À» ±¸ÃàÇÏ°í ÀÖ´Ù°í ¹àÇû´Ù.
³ª¸¶½ºÅ×(Namaste), ¹Ù³ªÄ¯(vanakkam), »ñ ½º¸® ¾ÆÄ®(sat sri akaal) ÀÌ Àλ縻µéÀº Çå¹ý¿¡¼ ÀÎÁ¤µÈ 22°³ ¾ð¾î¿Í Àα¸Á¶»ç¿¡ ±â·ÏµÈ 1,500°³ ÀÌ»óÀÇ ¾ð¾î¸¦ °¡Áø Àεµ¿¡¼ »ç¿ëÇÏ´Â 3°¡Áö Àλ縻¿¡ ºÒ°úÇÏ´Ù. ÀεµÀÇ Àα¸ ¾à 10%´Â ÀÎÅͳݿ¡¼ °¡Àå ¸¹ÀÌ »ç¿ëµÇ´Â ¾ð¾îÀÎ ¿µ¾î¸¦ »ç¿ëÇÑ´Ù.
¼¼°è¿¡¼ °¡Àå Àα¸°¡ ¸¹Àº ±¹°¡ÀÎ Àεµ´Â ±Þ¼ÓÇÑ µðÁöÅÐÈ¿¡ ¾ÕÀå¼°í ÀÖ´Ù. ¶ÇÇÑ, Àεµ ±â¾÷°ú ÇöÁö ½ºÅ¸Æ®¾÷Àº ´õ ¸¹Àº ÀεµÀÎÀÌ ¸ð±¹¾î·Î ±â¼ú°ú »óÈ£ÀÛ¿ëÇÒ ¼ö ÀÖµµ·Ï ´Ù±¹¾î AI ¸ðµ¨À» °³¹ßÇÏ°í ÀÖ´Ù. ÀÌ´Â ÇöÁö µ¥ÀÌÅÍ ¼¼Æ®¸¦ ±â¹ÝÀ¸·Î ±¸ÃàµÇ°í Áö¿ªÀÇ Æ¯Á¤ ¹æ¾ð, ¹®È, °üÇàÀ» ¹Ý¿µÇÏ´Â ±¹³» AI ÀÎÇÁ¶ó¸¦ °³¹ßÇÏ´Â ¼Ò¹ö¸° AIÀÇ »ç·Ê´Ù.
ÀÌ·¯ÇÑ ÇÁ·ÎÁ§Æ®µéÀº Àεµ¾î¿Í ¿µ¾î¸¦ À§ÇÑ ¾ð¾î ¸ðµ¨À» ±¸ÃàÇØ ±â¾÷¿ë °í°´ ¼ºñ½º AI ¿¡ÀÌÀüÆ®¸¦ °ÈÇÑ´Ù. ¾Æ¿ï·¯ ÄÜÅÙÃ÷¸¦ ½Å¼ÓÇÏ°Ô ¹ø¿ªÇØ Á¤º¸¿¡ ´ëÇÑ Á¢±Ù¼ºÀ» ³ÐÈ÷°í, 14¾ï ¸íÀÌ ³Ñ´Â ´Ù¾çÇÑ »ç¶÷µé¿¡°Ô º¸´Ù ½±°Ô ¼ºñ½º¸¦ Á¦°øÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÏ°í ÀÖ´Ù.
¿£ºñµð¾Æ(NVIDIA)´Â ÀÌ·¯ÇÑ À̴ϼÅƼºê¸¦ Áö¿øÇϱâ À§ÇØ Àεµ¿¡¼ °¡Àå º¸ÆíÀûÀ̸ç 5¾ï ¸í ÀÌ»óÀÌ »ç¿ëÇÏ°í ÀÖ´Â Èùµð¾î¸¦ À§ÇÑ sLMÀÎ ³×¸ðÆ®·Ð-4-¹Ì´Ï-Èùµð-4B¸¦ Ãâ½ÃÇß´Ù. ÇöÀç ¿£ºñµð¾Æ NIM ¸¶ÀÌÅ©·Î¼ºñ½º·Î Á¦°øµÇ´Â ÀÌ ¸ðµ¨Àº ¸ðµç ¿£ºñµð¾Æ GPU °¡¼Ó ½Ã½ºÅÛ¿¡ ½±°Ô ¹èÆ÷µÅ ¼º´ÉÀ» ÃÖÀûÈÇÒ ¼ö ÀÖ´Ù.
ÀεµÀÇ IT ¼ºñ½º¿Í ÄÁ¼³Æà ȸ»çÀÎ Å×Å© ¸¶Èùµå¶ó(Tech Mahindra)´Â Èùµð¾î¿Í ¼ö½Ê °³ÀÇ ¹æ¾ð¿¡ ÃÊÁ¡À» ¸ÂÃá Àδõ½º 2.0(Indus 2.0)À̶ó´Â AI ¸ðµ¨À» °³¹ßÇϱâ À§ÇØ ³×¸ðÆ®·Ð Èùµð NIM ¸¶ÀÌÅ©·Î¼ºñ½º¸¦ ÃÖÃÊ·Î »ç¿ëÇß´Ù. Àδõ½º 2.0Àº Å×Å© ¸¶Èùµå¶óÀÇ °íÇ°Áú ¹Ì¼¼ Á¶Á¤ µ¥ÀÌÅ͸¦ È°¿ëÇØ ¸ðµ¨ Á¤È®µµ¸¦ ³ôÀÓÀ¸·Î½á ÀºÇà, ±³À°, ÀÇ·á, ±âŸ »ê¾÷ ºÐ¾ßÀÇ °í°´ÀÌ ÇöÁöÈµÈ ¼ºñ½º¸¦ Á¦°øÇÒ ¼ö ÀÖ´Â ±âȸ¸¦ ¿¾îÁØ´Ù.
Å×Å© ¸¶Èùµå¶ó´Â Áö³ 10¿ù 23ÀϺÎÅÍ 25ÀϱîÁö ¹³¹ÙÀÌ¿¡¼ ÁøÇàµÈ ¿£ºñµð¾Æ AI ¼¹Ô(AI Summit)¿¡¼ Àδõ½º 2.0À» ¼±º¸¿´´Ù. ¾Æ¿ï·¯ ȸ»ç´Â ÀÚü ¼Ò¹ö¸° °Å´ë ¾ð¾î ¸ðµ¨(Large Language Model, LLM) Ç÷§ÆûÀÎ Å׳ë(TeNo)¸¦ °³¹ßÇÏ´Â µ¥ ¿£ºñµð¾Æ ³×¸ð(NeMo)¸¦ »ç¿ëÇÑ´Ù.
³×¸ðÆ®·Ð Èùµð ¸ðµ¨Àº 40¾ï °³ÀÇ ÆĶó¹ÌÅ͸¦ °¡Áö°í ÀÖÀ¸¸ç, ¿£ºñµð¾Æ¿¡¼ °³¹ßÇÑ 150¾ï °³ÀÇ ÆĶó¹ÌÅ͸¦ °¡Áø ´Ù±¹¾î ¾ð¾î ¸ðµ¨ÀÎ ³×¸ðÆ®·Ð-4 15B¿¡¼ ÆÄ»ýµÆ´Ù. ÀÌ ¸ðµ¨Àº »ý¼ºÇü AI °³¹ßÀ» À§ÇÑ ¿£µåÅõ¿£µå Ŭ¶ó¿ìµå ³×ÀÌƼºê ÇÁ·¹ÀÓ¿öÅ©ÀÌÀÚ ¸¶ÀÌÅ©·Î¼ºñ½º Á¦Ç°±ºÀÎ ¿£ºñµð¾Æ ³×¸ð¸¦ »ç¿ëÇß´Ù. À̸¦ ÅëÇØ ½ÇÁ¦ Èùµð¾î µ¥ÀÌÅÍ, ÇÕ¼º Èùµð¾î µ¥ÀÌÅÍ¿Í µ¿ÀÏÇÑ ¾çÀÇ ¿µ¾î µ¥ÀÌÅ͸¦ Á¶ÇÕÇØ Á¤Á¦¿Í ÃßÃâ, ÈÆ·ÃÀ» ¼öÇàÇß´Ù.
ÀÌ µ¥ÀÌÅÍ ¼¼Æ®´Â °íÇ°Áú ¸ÖƼ¸ð´Þ µ¥ÀÌÅ͸¦ ´ë±Ô¸ð·Î ó¸®ÇØ ÈƷðú »ç¿ëÀÚ Á¤ÀÇ¿¡ È°¿ëÇØ »ý¼ºÇü AI ¸ðµ¨ÀÇ Á¤È®µµ¸¦ Çâ»ó½ÃÅ°´Â ¿£ºñµð¾Æ ³×¸ð Å¥·¹ÀÌÅÍ(NeMo Curator)·Î Á¦À۵ƴÙ. ³×¸ð Å¥·¹ÀÌÅÍ´Â ¸ÖƼ³ëµå GPU ½Ã½ºÅÛ¿¡¼ µ¥ÀÌÅÍ Ã³¸® ÆÄÀÌÇÁ¶óÀÎÀ» °¡¼ÓÈÇØ Ã³¸® ½Ã°£°ú ÃѼÒÀ¯ºñ¿ëÀ» ³·Ãß±â À§ÇØ ¿£ºñµð¾Æ ·¡ÇÇÁî(RAPIDS) ¶óÀ̺귯¸®¸¦ »ç¿ëÇÑ´Ù. ¾Æ¿ï·¯ °íÇ°Áú µ¥ÀÌÅ͸¦ ó¸®Çϱâ À§ÇØ ÇÕ¼º µ¥ÀÌÅÍ »ý¼º, µ¥ÀÌÅÍ ÇÊÅ͸µ, ºÐ·ù, Áߺ¹ Á¦°Å¸¦ À§ÇÑ »çÀü ±¸ÃàµÈ ÆÄÀÌÇÁ¶óÀΰú ºôµù ºí·ÏÀ» Á¦°øÇÑ´Ù.
³×¸ð·Î ¹Ì¼¼ Á¶Á¤ÇÑ ÃÖÁ¾ ¸ðµ¨Àº ÃÖ´ë 80¾ï °³ÀÇ ÆĶó¹ÌÅ͸¦ °¡Áø AI ¸ðµ¨¿¡ ´ëÇÑ ¿©·¯ Á¤È®µµ º¥Ä¡¸¶Å©¿¡¼ ¿ì¼öÇÑ ¼º´ÉÀ» º¸ÀÌ°í ÀÖ´Ù. ÀÌ´Â NIM ¸¶ÀÌÅ©·Î¼ºñ½º·Î ÆÐŰ¡µÅ ±³À°, ¼Ò¸Å, ÀÇ·á µî ´Ù¾çÇÑ »ê¾÷ ºÐ¾ßÀÇ »ç¿ë »ç·Ê¸¦ Áö¿øÇÏ´Â µ¥ ½±°Ô È°¿ëµÉ ¼ö ÀÖ´Ù.
¶ÇÇÑ, ÀÌ ¸ðµ¨Àº ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise) ¼ÒÇÁÆ®¿þ¾î Ç÷§ÆûÀÇ ÀÏȯÀ¸·Î Á¦°øµÈ´Ù. À̸¦ ÅëÇØ ±â¾÷Àº AI °³¹ßÀ» ÇÁ·Î´ö¼Ç ȯ°æ¿¡ ¸ÂÃç °£¼ÒÈÇÒ ¼ö ÀÖ´Â ±â¼ú°ú ±â¾÷ ¼öÁØÀÇ º¸¾ÈÀ» ºñ·ÔÇÑ Ãß°¡ ¸®¼Ò½º¿¡ Á¢±ÙÇÒ ¼ö ÀÖ´Ù.
Àεµ Àü¿ªÀÇ Çõ½Å°¡, ÁÖ¿ä ±â¾÷, ±Û·Î¹ú ½Ã½ºÅÛ ÅëÇÕ¾÷ü´Â ¿£ºñµð¾Æ ³×¸ð¸¦ »ç¿ëÇØ ¸ÂÃãÇü ¾ð¾î ¸ðµ¨À» ±¸ÃàÇÏ°í ÀÖ´Ù.
÷´Ü ½ºÅ¸Æ®¾÷À» À§ÇÑ ¿£ºñµð¾Æ ÀμÁ¼Ç(Inception) ÇÁ·Î±×·¥¿¡ Âü¿©ÇÑ ±â¾÷µéÀº ¿©·¯ Àεµ ¾ð¾î¿¡ ´ëÇÑ AI ¸ðµ¨À» °³¹ßÇÏ´Â µ¥ ³×¸ð¸¦ »ç¿ëÇÏ°í ÀÖ´Ù.
»ç¸£¹ã AI(Sarvam AI)´Â ±â¾÷ °í°´¿¡°Ô À½¼º ´ë ÅؽºÆ®, ÅؽºÆ® ´ë À½¼º º¯È¯, ¹ø¿ª°ú µ¥ÀÌÅÍ ±¸¹® ºÐ¼® ¸ðµ¨À» Á¦°øÇÑ´Ù. ÀÌ È¸»ç´Â Àεµ ÃÖÃÊÀÇ ÀÚü °³¹ß ´Ù±¹¾î LLMÀÎ »ç¸£¹ã 1À» °³¹ßÇßÀ¸¸ç, ÀÌ ¸ðµ¨Àº ¿£ºñµð¾Æ H100 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU·Î ±¸µ¿µÇ´Â ÇöÁö AI ÀÎÇÁ¶ó¿¡¼ óÀ½ºÎÅÍ ÈƷõƴÙ.
³×¸ð Å¥·¹ÀÌÅÍ¿Í ³×¸ð ÇÁ·¹ÀÓ¿öÅ© µî ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî ¼ÒÇÁÆ®¿þ¾î¸¦ »ç¿ëÇØ °³¹ßµÈ »ç¸£¹ã 1Àº ¿µ¾î¿Í º¬°ñ¾î, ¸¶¶óƼ¾î, Ÿ¹Ð¾î, Åڷ籸¾î µî Àεµ ÁÖ¿ä 10°³ ¾ð¾î¸¦ Áö¿øÇÑ´Ù.
¶ÇÇÑ »ç¸£¹ã AI´Â ¿£ºñµð¾Æ NIM ¸¶ÀÌÅ©·Î¼ºñ½º, ´ëÈÇü AI¸¦ À§ÇÑ ¿£ºñµð¾Æ ¸®¹Ù(Riva), ¿£ºñµð¾Æ ÅÙ¼RT-LLM ¼ÒÇÁÆ®¿þ¾î, ¿£ºñµð¾Æ Æ®¸®Åæ Ãß·Ð ¼¹ö(Triton Inference Server)¸¦ »ç¿ëÇØ 1ÃÊ ¹Ì¸¸ÀÇ Áö¿¬ ½Ã°£À¸·Î ´ëÈÇü AI ¿¡ÀÌÀüÆ®¸¦ ÃÖÀûÈÇÏ°í ¹èÆ÷ÇÑ´Ù.
¶Ç ´Ù¸¥ ÀμÁ¼Ç ½ºÅ¸Æ®¾÷ÀÎ Áö³ª´Ï´å¿¡À̾ÆÀÌ(Gnani.ai)´Â ´Ù±¹¾î À½¼º º¯È¯ LLMÀ» ±¸ÃàÇß´Ù. ÀÌ ¸ðµ¨Àº Àεµ¿Í ¹Ì±¹ Àü¿ªÀÇ 150°³ ÀÌ»óÀÇ ÀºÇà, º¸Çè, ±ÝÀ¶ ¼ºñ½º ȸ»ç¿¡¼ ¸ÅÀÏ ¾à õ¸¸ °ÇÀÇ ½Ç½Ã°£ À½¼º »óÈ£ÀÛ¿ëÀ» ó¸®ÇÏ´Â AI °í°´ ¼ºñ½º ºñ¼¸¦ Áö¿øÇÑ´Ù. ÀÌ´Â 14°³ ¾ð¾î¸¦ Áö¿øÇÏ¸ç ¿£ºñµð¾Æ È£ÆÛ(Hopper) GPU¿Í ³×¸ð ÇÁ·¹ÀÓ¿öÅ©¸¦ »ç¿ëÇØ 1,400¸¸ ½Ã°£ ÀÌ»óÀÇ ´ëÈ À½¼º µ¥ÀÌÅ͸¦ ±â¹ÝÀ¸·Î ÈƷõƴÙ.
Áö³ª´Ï´å¿¡À̾ÆÀÌ´Â °¡»ó °í°´ ¼ºñ½º ºñ¼¿Í À½¼º ºÐ¼®À» À§ÇÑ AI¸¦ ÃÖÀûÈÇϱâ À§ÇØ ÅÙ¼RT-LLM, Æ®¸®Åæ Ãß·Ð ¼¹ö, ¸®¹Ù NIM ¸¶ÀÌÅ©·Î¼ºñ½º¸¦ »ç¿ëÇÑ´Ù.
¶ÇÇÑ, À§ÇÁ·Î¿Í TCS´Â ³×¸ð Å¥·¹ÀÌÅÍÀÇ ÇÕ¼º µ¥ÀÌÅÍ »ý¼º ÆÄÀÌÇÁ¶óÀÎÀ» »ç¿ëÇØ ¿µ¾î ÀÌ¿ÜÀÇ ¾ð¾î·Î µ¥ÀÌÅ͸¦ »ý¼ºÇØ °í°´À» À§ÇÑ LLMÀ» ¸ÂÃãÈÇÑ´Ù.
|