¿£ºñµð¾Æ°¡ 14ÀÏ ¿¸° ±¸±Û(Google) ¿¬·Ê °³¹ßÀÚ ÄÜÆÛ·±½ºÀÎ ±¸±Û I/O 2024¿¡¼ ¼¼ °¡Áö »õ·Î¿î Çù¾÷ ³»¿ëÀ» ¹ßÇ¥Çß´Ù. À̹ø Çù¾÷À¸·Î ¿£ºñµð¾Æ(NVIDIA)¿Í ±¸±ÛÀº ¼¼°èÀû ¼öÁØÀÇ ¼º´ÉÀ» °®Ãá AI ±â¹Ý ¾ÖÇø®ÄÉÀ̼ÇÀ» ´õ ½±°Ô ¸¸µé ¼ö ÀÖµµ·Ï °³¹ßÀÚ¸¦ Áö¿øÇÒ ¿¹Á¤ÀÌ´Ù.
ÅØ½ºÆ®, À̹ÌÁö, »ç¿îµå¿Í °°Àº ¿©·¯ À¯ÇüÀÇ µ¥ÀÌÅ͸¦ ó¸®ÇÏ´Â ¸ðµ¨ÀÌ Á¡Á¡ ´õ º¸ÆíÈµÇ¸é¼ »ý¼ºÇü AI¸¦ ±¸µ¿ÇÏ´Â °Å´ë ¾ð¾î ¸ðµ¨(large language model, LLM)¿¡ ´ëÇÑ Çõ½ÅÀÌ °¡¼Óȵǰí ÀÖ´Ù.
±×·¯³ª ÀÌ·¯ÇÑ ¸ðµ¨À» ±¸ÃàÇÏ°í ¹èÆ÷ÇÏ´Â °ÍÀº ¿©ÀüÈ÷ ¾î·Á¿î °úÁ¦´Ù. °³¹ßÀÚ´Â ¸ðµ¨À» ºü¸£°Ô °æÇèÇÏ°í Æò°¡ÇØ »ç¿ë »ç·Ê¿¡ °¡Àå ÀûÇÕÇÑ ¸ðµ¨À» °áÁ¤ÇÑ ´ÙÀ½, ºñ¿ë È¿À²ÀûÀÏ »Ó¸¸ ¾Æ´Ï¶ó ÃÖ»óÀÇ ¼º´ÉÀ» Á¦°øÇÏ´Â ¹æ½ÄÀ¸·Î ¸ðµ¨À» ÃÖÀûÈÇÒ ¼ö ÀÖ´Â ¹æ¹ýÀÌ ÇÊ¿äÇÏ´Ù.
¿£ºñµð¾Æ´Â À̹ø Çà»ç¿¡¼ ±¸±ÛÀÌ ¼±º¸ÀÎ µÎ °¡Áö »õ·Î¿î ¸ðµ¨ÀÎ Áª¸¶ 2(Gemma 2)¿Í ÆÈ¸®Áª¸¶(PaliGemma)¸¦ ÃÖÀûÈÇϱâ À§ÇØ ÅÙ¼RT-LLM(TensorRT-LLM)À» »ç¿ëÇϰí ÀÖ´Ù. ÀÌ µÎ ¸ðµ¨µéÀº ¸ðµÎ Á¦¹Ì³ªÀÌ(Gemini)¸¦ ¸¸µå´Â µ¥ »ç¿ëµÈ µ¿ÀÏÇÑ ¿¬±¸¿Í ±â¼úÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÆÀ¸¸ç, °¢°¢ ƯÁ¤ ¿µ¿ª¿¡ ÁßÁ¡À» µÐ´Ù.
Áª¸¶ 2´Â ±¤¹üÀ§ÇÑ »ç¿ë »ç·Ê¸¦ À§ÇÑ Â÷¼¼´ë Áª¸¶ ¸ðµ¨·Î, ȹ±âÀûÀÎ ¼º´É°ú È¿À²¼ºÀ» À§ÇØ ¼³°èµÈ ¿ÏÀüÈ÷ »õ·Î¿î ¾ÆÅ°ÅØÃ³°¡ Ư¡ÀÌ´Ù.
ÆÈ¸®Áª¸¶´Â PaLI-3¿¡¼ ¿µ°¨À» ¹ÞÀº °³¹æÇü ½Ã°¢ ¾ð¾î ¸ðµ¨(VLM, vision language model)ÀÌ´Ù. ÀÌ´Â SigLIP ½Ã°¢ ¸ðµ¨°ú Áª¸¶ ¾ð¾î ¸ðµ¨À» Æ÷ÇÔÇÑ °³¹æÇü ±¸¼º ¿ä¼Ò¸¦ ±â¹ÝÀ¸·Î ±¸ÃàµÆÀ¸¸ç, À̹ÌÁö, ªÀº ºñµð¿À ĸ¼Ç, ½Ã°¢Àû À̹ÌÁö ÁúÀÇÀÀ´ä, À̹ÌÁö ³» ÅØ½ºÆ® ÀÌÇØ, °´Ã¼ °¨Áö³ª ºÐÇÒ°ú °°Àº ½Ã°¢ ¾ð¾î ÀÛ¾÷À» À§ÇØ ¼³°èµÆ´Ù. ÆÈ¸®Áª¸¶´Â ±¤¹üÀ§ÇÑ ½Ã°¢ ¾ð¾î ÀÛ¾÷¿¡¼ ÃÖ°í ¼öÁØÀÇ ¹Ì¼¼ Á¶Á¤ ¼º´ÉÀ» žÀçÇß°í ¿£ºñµð¾Æ JAX-Åø¹Ú½º(JAX-Toolbox)¿¡¼µµ Áö¿øµÈ´Ù.
Áª¸¶ 2¿Í ÆÈ¸®Áª¸¶´Â ´ë±Ô¸ð AI ¸ðµ¨ ¹èÆ÷¸¦ °£¼ÒÈÇÏ´Â ¿£ºñµð¾Æ AI ¿£ÅÍÇÁ¶óÀÌÁî(AI Enterprise) ¼ÒÇÁÆ®¿þ¾î Ç÷§ÆûÀÇ ÀϺÎÀÎ ¿£ºñµð¾Æ NIM Ãß·Ð ¸¶ÀÌÅ©·Î¼ºñ½º¿Í ÇÔ²² Á¦°øµÉ ¿¹Á¤ÀÌ´Ù. »õ·Î¿î µÎ ¸ðµ¨¿¡ ´ëÇÑ NIM Áö¿øÀº ÆÈ¸®Áª¸¶¸¦ ½ÃÀÛÀ¸·Î API īŻ·Î±×¿¡¼ »ç¿ëÇÒ ¼ö ÀÖÀ¸¸ç, °ð ¿£ºñµð¾Æ NGC¿Í ±êÇãºê(GitHub)¿¡¼ ÄÁÅ×À̳ʷΠÃâ½ÃµÉ ¿¹Á¤ÀÌ´Ù.
±¸±ÛÀº µ¥ÀÌÅÍ °úÇÐÀÚ¿¡°Ô °¡Àå Àαâ ÀÖ´Â °³¹ßÀÚ Ç÷§Æû Áß ÇϳªÀÎ ±¸±Û ÄÚ·¦(Colab)¿¡¼ ¿ÀÇ ¼Ò½º GPU µ¥ÀÌÅÍ ÇÁ·¹ÀÓ ¶óÀ̺귯¸®ÀÎ ·¡ÇÇÁî cuDF(RAPIDS cuDF)°¡ ±âº»À¸·Î Áö¿øµÈ´Ù°í ¹ßÇ¥Çß´Ù. ¸Å¿ù õ¸¸ ¸í¿¡ ´ÞÇÏ´Â ±¸±Û ÄÚ·¦ÀÇ ¿ù°£ »ç¿ëÀÚµéÀº ÀÌÁ¦ ÄÚµå º¯°æ ¾øÀÌ ´Ü ¸î ÃÊ ¸¸¿¡ ¿£ºñµð¾Æ L4 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU¸¦ »ç¿ëÇØ ÆÇ´Ù½º(pandas) ±â¹Ý ÆÄÀ̽ã(Python) ¿öÅ©Ç÷ο츦 ÃÖ´ë 50¹è±îÁö °¡¼ÓÈÇÒ ¼ö ÀÖ´Ù.
±¸±Û ÄÚ·¦À» »ç¿ëÇÏ´Â °³¹ßÀÚ´Â ·¡ÇÇÁî cuDF¸¦ ÅëÇØ Ž»öÀû ºÐ¼®(exploratory analysis)°ú »ý»ê µ¥ÀÌÅÍ ÆÄÀÌÇÁ¶óÀÎÀÇ ¼Óµµ¸¦ ³ôÀÏ ¼ö ÀÖ´Ù. ÆÇ´Ù½º´Â Á÷°üÀûÀÎ API·Î ÀÎÇØ ¼¼°è¿¡¼ °¡Àå Àαâ ÀÖ´Â µ¥ÀÌÅÍ Ã³¸® µµ±¸ Áß ÇϳªÀÌÁö¸¸ µ¥ÀÌÅÍ ±Ô¸ð°¡ Ä¿Áú¼ö·Ï ¾ÖÇø®ÄÉÀ̼ǿ¡ ¹®Á¦°¡ Á¾Á¾ »ý±ä´Ù. 5~10GB Å©±âÀÇ µ¥ÀÌÅÍ¶óµµ CPU¿¡¼ °£´ÜÇÑ ÀÛ¾÷À» ¿Ï·áÇÏ´Â µ¥ ¸î ºÐÀ̳ª °É¸®±âµµ Çϱ⠶§¹®¿¡, Ž»öÀû ºÐ¼®°ú »ý»ê µ¥ÀÌÅÍ ÆÄÀÌÇÁ¶óÀÎÀÇ ¼Óµµ°¡ ´À·ÁÁú ¼ö ÀÖ´Ù.
ÀÌ °æ¿ì ·¡ÇÇÁî cuDF´Â GPU¿¡¼ ÆÇ´Ù½º Äڵ带 ¿øÈ°ÇÏ°Ô °¡¼ÓÇϰí, ±×·¸Áö ¾ÊÀº °æ¿ì CPU-ÆÇ´Ù½º(CPU-pandas)·Î µÇµ¹¾Æ°¡ ÀÌ ¹®Á¦¸¦ ÇØ°áÇϵµ·Ï ¼³°èµÆ´Ù. ÄÚ·¦¿¡¼ ±âº»ÀûÀ¸·Î »ç¿ëÇÒ ¼ö ÀÖ´Â ·¡ÇÇÁî cuDF¸¦ ÅëÇØ ¸ðµç °³¹ßÀÚ´Â ¾îµð¼³ª °¡¼ÓÈµÈ µ¥ÀÌÅÍ ºÐ¼®À» Ȱ¿ëÇÒ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ¿Í ±¸±ÛÀº ¿£ºñµð¾Æ RTX ±×·¡ÇÈÀ» »ç¿ëÇØ AI PC¸¦ Ȱ¿ëÇÏ´Â ÆÄÀ̾À̽º Á¨Å¶(Firebase Genkit)¿¡ ´ëÇÑ Çù¾÷µµ ¹ßÇ¥Çß´Ù. ÀÌ´Â °³¹ßÀÚ°¡ »õ·Î¿î Áª¸¶ ¸ðµ¨ Á¦Ç°±ºÀ» ºñ·ÔÇÑ »ý¼ºÇü AI ¸ðµ¨À» À¥°ú ¸ð¹ÙÀÏ ¾ÖÇø®ÄÉÀ̼ǿ¡ ½±°Ô ÅëÇÕÇØ ¸ÂÃãÇü ÄÜÅÙÃ÷, ½Ã¸Çƽ °Ë»ö(semantic search), ¹®ÀÇ¿¡ ´ëÇÑ ´äº¯À» Á¦°øÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. °³¹ßÀÚ´Â ·ÎÄà RTX GPU·Î ÀÛ¾÷ ÁÙ±â(work stream)¸¦ ½ÃÀÛÇÑ ´ÙÀ½, ÀÛ¾÷À» ±¸±Û Ŭ¶ó¿ìµå(Google Cloud) ÀÎÇÁ¶ó·Î ¿øÈ°ÇÏ°Ô À̵¿ÇÒ ¼ö ÀÖ´Ù.
°³¹ßÀÚµéÀº ¸ð¹ÙÀÏ °³¹ßÀÚµéÀÌ ÁÖ·Î ¾²´Â ÇÁ·Î±×·¡¹Ö ¾ð¾îÀÎ ÀÚ¹Ù½ºÅ©¸³Æ®(JavaScript)¸¦ »ç¿ëÇÏ´Â Á¨Å¶À¸·Î ¾ÛÀ» ´õ¿í ½±°Ô °³¹ßÇÒ ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ¿Í ±¸±Û Ŭ¶ó¿ìµå´Â AIÀÇ ¹ßÀüÀ» À§ÇØ ´Ù¾çÇÑ ºÐ¾ß¿¡¼ Çù·ÂÇϰí ÀÖ´Ù. °ð Ãâ½ÃµÉ ±×·¹À̽º ºí·¢À£(Grace Blackwell) ±â¹Ý DGX Ŭ¶ó¿ìµå Ç÷§Æû°ú JAX ÇÁ·¹ÀÓ¿öÅ© Áö¿øºÎÅÍ ±¸±Û Äí¹ö³×Ƽ½º ¿£Áø(Kubernetes Engine)¿¡ ¿£ºñµð¾Æ ³×¸ð(NeMo) ÇÁ·¹ÀÓ¿öÅ© µµÀÔ±îÁö, ¾ç»çÀÇ Ç®½ºÅÃ(full-stack) ÆÄÆ®³Ê½ÊÀº »ç¿ëÀÚ°¡ ±¸±Û Ŭ¶ó¿ìµå¿¡¼ ¿£ºñµð¾Æ ±â¼úÀ» »ç¿ëÇØ AI·Î ¼öÇàÇÒ ¼ö ÀÖ´Â ÀÛ¾÷ÀÇ °¡´É¼ºÀ» È®ÀåÇϰí ÀÖ´Ù.
|