AI ÄÄÇ»ÆÃ ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ´Â ¹Ì±¹ »õ³ÊÁ¦ÀÌ¿¡¼ ¿¸° ¼¼°è ÃÖ´ë AI•°¡¼Ó ÄÄÇ»ÆÃ ÄÜÆÛ·±½ºÀÎ ‘¿£ºñµð¾Æ(NVIDIA) GTC 2026’¿¡¼ ¿£ºñµð¾Æ DGX ½ºÆÄÅ©(DGX Spark)¿Í ¿£ºñµð¾Æ RTX PC¿¡¼ ÃֽŠ¿ÀÇ ¸ðµ¨°ú AI ¿¡ÀÌÀüÆ®¸¦ ·ÎÄà ȯ°æ¿¡¼ ºñ¿ë ºÎ´ã ¾øÀÌ ¾ÈÀüÇÏ°Ô ½ÇÇàÇÒ ¼ö ÀÖ´Ù°í ¹àÇû´Ù.
±×µ¿¾È ÄÁ½´¸Ó ÄÄÇ»ÆÃÀÇ ÆÐ·¯´ÙÀÓÀº PC¿¡¼ ½º¸¶Æ®Æù, ÅÂºí¸´¿¡ À̸£±â±îÁö ‘°³ÀÎ¿ë µð¹ÙÀ̽º’¶ó´Â °³³äÀ» Áß½ÉÀ¸·Î ÁøÈÇØ ¿Ô´Ù. ±×·¯³ª »ý¼ºÇü AI, ƯÈ÷ ¿ÀÇÂŬ·Î(OpenClaw)ÀÇ µîÀåÀº ‘¿¡ÀÌÀüÆ® ÄÄÇ»ÅÍ’¶ó´Â ¿ÏÀüÈ÷ »õ·Î¿î Ä«Å×°í¸®¸¦ ź»ý½ÃÄ×´Ù. ÀÌ °¡¿îµ¥ ¿£ºñµð¾Æ DGX ½ºÆÄÅ© µ¥½ºÅ©Åé AI ½´ÆÛÄÄÇ»ÅÍ, ¿£ºñµð¾Æ RTX PC¸¦ ºñ·ÔÇÑ µð¹ÙÀ̽ºµéÀº ºñ¿ë ºÎ´ã ¾øÀÌ ¾ÈÀüÇÏ°Ô °³ÀÎ¿ë ¿¡ÀÌÀüÆ®¸¦ ±¸µ¿ÇÒ ¼ö ÀÖ´Â ÃÖÀûÀÇ ÀÎÇÁ¶ó·Î ÀÚ¸®¸Å±èÇϰí ÀÖ´Ù.
À̹ø ¿£ºñµð¾Æ GTC¿¡¼´Â ´ÙÀ½°ú °°Àº Çõ½ÅÀûÀÎ ¿¡ÀÌÀüƽ AI °ü·Ã ¹ßÇ¥µéÀÌ ¼Ò°³µÆ´Ù:
·ÎÄà ¿¡ÀÌÀüÆ®¸¦ À§ÇÑ ½Å±Ô ¿ÀÇ ¸ðµ¨ °ø°³: ¿£ºñµð¾Æ ³×¸ðÆ®·Ð 3 ³ª³ë 4B(Nemotron 3 Nano 4B)¿Í ³×¸ðÆ®·Ð 3 ½´ÆÛ 120B(Nemotron 3 Super 120B)¸¦ Æ÷ÇÔÇÑ ½Å±Ô ¸ðµ¨ÀÌ »õ·Ó°Ô °ø°³µÆÀ¸¸ç, Å¥¿ø 3.5(Qwen 3.5)¿Í ¹Ì½ºÆ®¶ö ½º¸ô 4(Mistral Small 4)¿¡ ´ëÇÑ ÃÖÀûȰ¡ ÀÌ·ïÁ³´Ù.
¿£ºñµð¾Æ ³×¸ðŬ·Î(NemoClaw) Ãâ½Ã: ¿ÀÇÂŬ·Î¸¦ À§ÇÑ ¿ÀÇ ¼Ò½º ½ºÅÃÀÎ ³×¸ðŬ·Î´Â º¸¾È¼ºÀ» °ÈÇÏ°í ·ÎÄà ¸ðµ¨À» Áö¿øÇÔÀ¸·Î½á ¿£ºñµð¾Æ µð¹ÙÀ̽º¿¡¼ÀÇ ¿ÀÇÂŬ·Î »ç¿ëÀÚ °æÇèÀ» ±Ø´ëÈÇÑ´Ù.
¾ð½½·Î½º ½ºÆ©µð¿À(Unsloth Studio)¸¦ ÅëÇÑ ÆÄÀÎÆ©´×(fine-tuning) °£¼ÒÈ: ¿¡ÀÌÀüƽ ¿öÅ©Ç÷ο츦 À§ÇÑ ¿ÀÇ ¸ðµ¨ÀÇ Á¤È®µµ¸¦ ´õ¿í Çâ»ó½Ãų ¼ö ÀÖµµ·Ï ÆÄÀÎÆ©´×ÀÌ ÇÑÃþ ½¬¿öÁ³´Ù.
GTC Âü°¡ÀÚµéÀº 3¿ù 19ÀÏ(ÇöÁö½Ã°£)±îÁö ¸ÅÀÏ ¿ÀÀü 8½Ã~¿ÀÈÄ 5½Ã GTC ÆÄÅ©(GTC Park)¿¡¼ ¿¸° ‘¿£ºñµð¾Æ ºôµå ¾î Ŭ·Î(build-a-claw)’ À̺¥Æ®¿¡ Âü¿©Çß´Ù. ÇöÀåÀÇ ¿£ºñµð¾Æ Àü¹®°¡µéÀº Âü°¡ÀÚµéÀÌ °¢ÀÚÀÇ µð¹ÙÀ̽º¸¦ Ȱ¿ëÇØ »ó½Ã ±¸µ¿µÇ´Â ´Éµ¿Çü AI ¾î½Ã½ºÅÏÆ®¸¦ ¸ÂÃãÇüÀ¸·Î ±¸Ãà•¹èÆ÷ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇß´Ù. Çà»ç´Â ±â¼ú ¼÷·Ãµµ¿Í °ü°è¾øÀÌ ´©±¸³ª Âü¿©ÇÒ ¼ö ÀÖ¾úÀ¸¸ç, Âü°¡ÀÚµéÀº ÀÚ½ÅÀÇ ¿¡ÀÌÀüÆ®¿¡ À̸§À» ºÙÀÌ°í ¼º°ÝÀ» Á¤ÀÇÇϸç ÇÊ¿äÇÑ µµ±¸¿¡ ´ëÇÑ Á¢±Ù ±ÇÇÑÀ» ºÎ¿©ÇØ, Æò¼Ò »ç¿ëÇÏ´Â ¸Þ½Ã¡ ¾ÛÀ» ÅëÇØ ¼ÒÅëÇÒ ¼ö ÀÖ´Â °³ÀÎ¿ë ¾î½Ã½ºÅÏÆ®¸¦ Á÷Á¢ Á¦ÀÛÇÒ ¼ö ÀÖ¾ú´Ù.
½Å±Ô ¿ÀÇ ¸ðµ¨, ·ÎÄà ¿¡ÀÌÀüÆ®¿¡ Ŭ¶ó¿ìµå±Þ ǰÁú Á¦°ø
ºñ¾àÀûÀ¸·Î È®ÀåµÈ ÄÁÅØ½ºÆ® À©µµ¿ì(context window)¸¦ °®Ãá Â÷¼¼´ë ·ÎÄà ¸ðµ¨Àº PC¿¡¼ ¿¡ÀÌÀüÆ®¸¦ ±¸µ¿ÇÒ ¼ö ÀÖ´Â ÀÎÅÚ¸®Àü½º¸¦ Á¦°øÇÑ´Ù. dzºÎÇÑ »ç¿ëÀÚ ÄÁÅØ½ºÆ®¿Í °·ÂÇÑ ·ÎÄà µµ±¸ÀÇ °áÇÕÀº AI PCÀÇ »õ·Î¿î °¡´É¼ºÀ» ¿°í ÀÖ´Ù. ƯÈ÷ 128GB ÅëÇÕ ¸Þ¸ð¸®¸¦ ±â¹ÝÀ¸·Î 1,200¾ï °³ ÀÌ»óÀÇ ÆÄ¶ó¹ÌÅ͸¦ °®Ãç ´ë±Ô¸ð ¸ðµ¨À» ¼ö¿ëÇÒ ¼ö ÀÖ´Â DGX ½ºÆÄÅ©´Â ÀÌ·¯ÇÑ ÀáÀç·ÂÀ» ±Ø´ëÈÇÑ´Ù.
ÃÖ±Ù Ãâ½ÃµÈ ³×¸ðÆ®·Ð 3 ½´ÆÛ´Â 1,200¾ï °³ÀÇ ÆÄ¶ó¹ÌÅÍ¿Í 120¾ï °³ÀÇ È°¼º ÆÄ¶ó¹ÌÅ͸¦ º¸À¯ÇÑ ¿ÀÇ ¸ðµ¨ÀÌ´Ù. º¹ÀâÇÑ ¿¡ÀÌÀüƽ AI ½Ã½ºÅÛ ±¸µ¿À» À§ÇØ ¼³°èµÆÀ¸¸ç, DGX ½ºÆÄÅ©³ª ¿£ºñµð¾Æ RTX PRO ¿öÅ©½ºÅ×À̼ǿ¡¼ ¿¡ÀÌÀüÆ®¸¦ °¡µ¿ÇÏ´Â µ¥ ÃÖÀûÀÇ ¼º´ÉÀ» ¹ßÈÖÇÑ´Ù. ƯÈ÷ ¿ÀÇÂŬ·Î ȯ°æ¿¡¼ °Å´ë ¾ð¾î ¸ðµ¨(large language model, LLM) ¼º´ÉÀ» ÃøÁ¤ÇÏ´Â »õ·Î¿î º¥Ä¡¸¶Å© ‘ÇÉÄ¡º¥Ä¡(PinchBench)’¿¡¼ 85.6%¸¦ ±â·ÏÇϸç, µ¿±Þ ´ëºñ ÃÖ°íÀÇ ¿ÀÇ ¸ðµ¨ÀÓÀ» ÀÔÁõÇß´Ù.
¹Ì½ºÆ®¶ö ½º¸ô 4´Â 1,190¾ï °³ ÆÄ¶ó¹ÌÅÍ ±Ô¸ðÀÇ ¿ÀÇ ¸ðµ¨ÀÌ´Ù. 60¾ï °³ÀÇ È°¼º ÆÄ¶ó¹ÌÅÍ¿Í Àüü ·¹ÀÌ¾î ±âÁØ 80¾ï °³ ¼öÁØÀÇ ±¸¼ºÀ» ÅëÇØ, ¹Ì½ºÆ®¶ö Ç÷¡±×½Ê ¸ðµ¨ÀÇ ¿ª·®À» Çϳª·Î Áý¾àÇß´Ù. À̸¦ ÅëÇØ »ç¿ëÀÚµéÀº ÀϹÝÀûÀΠäÆÃ°ú ÄÚµùÀº ¹°·Ð, ¿¡ÀÌÀüƽ ÀÛ¾÷¿¡ ÃÖÀûÈµÈ °íÈ¿À² ¸ðµ¨À» Ȱ¿ëÇÒ ¼ö ÀÖ´Ù.
µÎ ¸ðµ¨ ¸ðµÎ DGX ½ºÆÄÅ©¿Í RTX PRO GPU¿¡¼ ·ÎÄà ȯ°æÀ¸·Î ±¸µ¿µÈ´Ù.
º¸´Ù °æ·®ÀÇ ¸ðµ¨À» Ȱ¿ëÇÏ·Á´Â ÁöÆ÷½º(GeForce) RTX »ç¿ëÀÚµéÀ» À§ÇØ, ¿£ºñµð¾Æ ³×¸ðÆ®·Ð 3 ¿ÀÇ ¸ðµ¨ Á¦Ç°±ºÀÇ ÃֽЏðµ¨ÀÎ ³×¸ðÆ®·Ð 3 ³ª³ë 4B°¡ Ãâ½ÃµÆ´Ù. ÀÌ ¸ðµ¨Àº RTX AI PC¿¡¼ ·ÎÄà ±â¹Ý ¿¡ÀÌÀüÆ®¿Í ¾î½Ã½ºÅÏÆ®¸¦ ±¸ÃàÇϱâ À§ÇÑ ÃÖÀûÀÇ ±â¹ÝÀ» Á¦°øÇÑ´Ù. ƯÈ÷ Çϵå¿þ¾î ÀÚ¿øÀÌ Á¦ÇÑµÈ È¯°æ¿¡¼ ±¸µ¿µÇ´Â °ÔÀÓÀ̳ª ¾ÖÇø®ÄÉÀÌ¼Ç ³» ½ÇÇàÇü•´ëÈÇü Æä¸£¼Ò³ª(persona) ±¸Çö¿¡ ÀûÇÕÇÏ´Ù. ³×¸ðÆ®·Ð 3 ³ª³ë 4B´Â ¿£ºñµð¾Æ GPU ±â¹Ý ½Ã½ºÅÛ Àü¹Ý¿¡¼ Ȱ¿ë °¡´ÉÇϸç, ÃÖ¼Ò ¼öÁØÀÇ VRAM¸¸À¸·Îµµ ³ôÀº ¼öÁØÀÇ Áö½Ã ÀÌÇà ´É·Â°ú ¿ì¼öÇÑ µµ±¸ Ȱ¿ë ¼º´ÉÀ» ¹ßÈÖÇÑ´Ù.
ÀÌ¿Í ÇÔ²² ¿£ºñµð¾Æ´Â ¶Ù¾î³ Á¤È®µµ¸¦ ÀÔÁõÇÑ ¾Ë¸®¹Ù¹Ù(Alibaba) Å¥¿ø 3.5 27B•9B•4B ¸ðµ¨¿¡ ´ëÇÑ ÃÖÀûȸ¦ ¹ßÇ¥Çß´Ù. ÇØ´ç ¸ðµ¨µéÀº ¿£ºñµð¾Æ GPU¿¡¼ ·ÎÄà ¿¡ÀÌÀüÆ®¸¦ ±¸µ¿ÇÏ´Â µ¥ ÀûÇÕÇϸç, ºñÀü°ú ´ÙÁß ÅäÅ« ¿¹Ãø, 26¸¸ 2,000 ÅäÅ«¿¡ ´ÞÇÏ´Â ´ë±Ô¸ð ÄÁÅØ½ºÆ® À©µµ¿ì¸¦ ±âº»À¸·Î Áö¿øÇÑ´Ù. ƯÈ÷ 270¾ï ÆÄ¶ó¹ÌÅÍ ±Ô¸ðÀÇ ¹ÐÁý ¸ðµ¨Àº RTX 5090 GPU¿Í °áÇÕµÉ ¶§ ´õ¿í ¶Ù¾î³ ¼º´ÉÀ» ¹ßÈÖÇÑ´Ù.
¸ðµç ±¸¼ºÀº Q4_K_M ¾çÀÚȸ¦ Àû¿ëÇϰí, BS = 1, ISL = 1024, OSL = 128 Á¶°Ç¿¡¼ ¿£ºñµð¾Æ RTX 5090°ú ¸Æ M3 ¿ïÆ®¶ó(Mac M3 Ultra) µ¥½ºÅ©ÅéÀ» ±âÁØÀ¸·Î ÃøÁ¤µÆ´Ù. ÅäÅ« »ý¼º 󸮷®Àº ¶ó¸¶.cpp(llama.cpp) b7789¿¡¼ ¶ó¸¶ º¥Ä¡ µµ±¸¸¦ Ȱ¿ëÇØ »êÃâµÆ´Ù.
ÀÌ ¸ðµ¨µéÀº ¿Ã¶ó¸¶(Ollama), LM ½ºÆ©µð¿À(LM Studio), ¶ó¸¶.cpp¸¦ ÅëÇØ Ȱ¿ëÇÒ ¼ö ÀÖÀ¸¸ç, »ç¿ëÀÚ´Â RTX GPU¿Í DGX ½ºÆÄÅ©¸¦ ±â¹ÝÀ¸·Î °¡¼ÓÈµÈ Ãß·ÐÀ» °æÇèÇÒ ¼ö ÀÖ´Ù. ¿©±â¿¡¼ ¿£ºñµð¾Æ ¿ÀÇ ¸ðµ¨¿¡ ´ëÇØ ¾Ë¾Æº¼ ¼ö ÀÖ´Ù.
ÃֽŠRTX ÃÖÀûÈ ¸ðµ¨·Î °¡¼ÓÇÏ´Â Å©¸®¿¡ÀÌÆ¼ºê AI
ÀÌ´Þ ÃÊ Ãâ½ÃµÈ ¶óÀÌÆ®¸¯½º(Lightricks)ÀÇ ÃÖ÷´Ü ¿Àµð¿À-ºñµð¿À ¸ðµ¨ LTX 2.3Àº NVFP4¿Í FP8 Áõ·ù ¸ðµ¨(distilled model)À» Áö¿øÇϸç, ÃÖ´ë 2.1¹è ºü¸¥ ¼º´É Çâ»óÀ» ±¸ÇöÇÑ´Ù. ¿©±â¿¡¼ ¶óÀÌÆ®¸¯½º LTX 2.3 ¸ðµ¨¿¡ ´ëÇØ ÀÚ¼¼È÷ ¾Ë¾Æº¼ ¼ö ÀÖ´Ù.
¶ÇÇÑ ºí·¢ Æ÷·¹½ºÆ® ·¦½º(Black Forest Labs)ÀÇ Ç÷°½º.2 Ŭ¶óÀÎ 9B(FLUX.2 Klein 9B) ¸ðµ¨Àº ÃÖ±Ù ¾÷µ¥ÀÌÆ®¸¦ ÅëÇØ À̹ÌÁö ÆíÁý ¼Óµµ°¡ ÃÖ´ë 2¹è Çâ»óµÆ´Ù. ¿£ºñµð¾Æ´Â ºí·¢ Æ÷·¹½ºÆ® ·¦½º¿Í Çù·ÂÇØ RTX GPU¿¡¼ ÃÖÀûÀÇ ¼º´É°ú ¸Þ¸ð¸® È¿À²À» Á¦°øÇÏ´Â FP8 ¹öÀüÀ» Ãâ½ÃÇß´Ù.
¿£ºñµð¾Æ ³×¸ðŬ·Î, ¿ÀÇÂŬ·Î¸¦ À§ÇÑ ¿£ºñµð¾Æ ÃÖÀûÈ ¼Ö·ç¼Ç
AI °³¹ßÀÚ¿Í ¾ÖÈ£°¡µéÀº DGX ½ºÆÄÅ© ½´ÆÛÄÄÇ»Å͸¦ ±¸¸ÅÇϰųª Àü¿ë RTX PC¸¦ ±¸ÃàÇØ, °³ÀÎ ÆÄÀϰú ¾Û, ¿öÅ©Ç÷ο쿡¼ ÄÁÅØ½ºÆ®¸¦ °¡Á®¿Í ÀÏ»ó ¾÷¹«¸¦ ÀÚµ¿ÈÇÒ ¼ö ÀÖ´Â ¿ÀÇÂŬ·Î µî ÀÚÀ² AI ¿¡ÀÌÀüÆ®¸¦ ½ÇÇàÇϰí ÀÖ´Ù. ±×·¯³ª ¿ÀÇÂŬ·Î¿Í °°Àº ¿¡ÀÌÀüƽ ½Ã½ºÅÛÀÌ º¸±ÞµÊ¿¡ µû¶ó, ÅäÅ« ºñ¿ë»Ó¸¸ ¾Æ´Ï¶ó º¸¾È, ÇÁ¶óÀ̹ö½Ã¿¡ ´ëÇÑ ¿ì·Áµµ Ä¿Áö°í ÀÖ´Ù.
ÀÌ·¯ÇÑ ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇØ ¿£ºñµð¾Æ´Â ¿£ºñµð¾Æ µð¹ÙÀ̽º¿¡¼ ¿ÀÇÂŬ·Î ÃÖÀûȸ¦ ±¸ÇöÇÏ´Â ¿ÀÇ ¼Ò½º ½ºÅà ³×¸ðŬ·Î¸¦ °ø°³Çß´Ù. ³×¸ðŬ·Î¿¡¼ Á¦°øµÇ´Â ù ¹øÂ° ±â´ÉÀº ¿£ºñµð¾Æ ³×¸ðÆ®·Ð ¿ÀÇ ¸ðµ¨°ú ¿£ºñµð¾Æ ¿Àǽ©(OpenShell) ·±Å¸ÀÓÀÌ´Ù. ³×¸ðÆ®·Ð ·ÎÄà ¸ðµ¨À» »ç¿ëÇÏ¸é »ç¿ëÀÚ°¡ Ãß·ÐÀ» ·ÎÄÿ¡¼ ½ÇÇàÇÒ ¼ö ÀÖ¾î, ÇÁ¶óÀ̹ö½Ã°¡ °ÈµÇ°í ÅäÅ« ºñ¿ëÀÌ ¹ß»ýÇÏÁö ¾Ê´Â´Ù. ¿Àǽ©Àº Ŭ·Î(claw)¸¦ º¸´Ù ¾ÈÀüÇÏ°Ô ½ÇÇàÇϵµ·Ï ¼³°èµÈ ·±Å¸ÀÓÀÌ´Ù.
¿©±â¿¡¼ ³×¸ðŬ·Î¿¡ ´ëÇØ ÀÚ¼¼È÷ ¾Ë¾Æº¼ ¼ö ÀÖÀ¸¸ç, ¿£ºñµð¾Æ ⸳ÀÚ °â CEO Á¨½¼ Ȳ(Jensen Huang)ÀÇ GTC ±âÁ¶¿¬¼³°ú ¼¼¼ÇÀ» È®ÀÎÇÒ ¼ö ÀÖ´Ù.
¾ð½½·Î½º ½ºÆ©µð¿À·Î ÆÄÀÎÆ©´× °£¼ÒÈ
¿ÀÇ ¸ðµ¨ÀÌ ºü¸£°Ô ¹ßÀüÇÔ¿¡ µû¶ó, »ç¿ëÀÚ µ¥ÀÌÅÍ¿Í »ç¿ë »ç·Ê¿¡ ¸ÂÃç ¸ðµ¨À» ÃÖÀûÈÇÏ´Â ÆÄÀÎÆ©´× ±â¼úÀÌ ¸ðµ¨ Á¤È®µµ¸¦ ³ôÀÌ´Â ÇÙ½É ¼ö´ÜÀ¸·Î ÁÖ¸ñ¹Þ°í ÀÖ´Ù. ±âÁ¸¿¡´Â ÆÄÀÎÆ©´×À» ¼öÇàÇÏ·Á¸é ±íÀº ±â¼úÀû Àü¹®¼º°ú ÄÚµù ¿ª·®, ¹æ´ëÇÑ ¼³Á¤ °úÁ¤ÀÌ ÇÊ¿äÇß´Ù. ¸ðµ¨ ÆÄÀÎÆ©´×°ú Á¤·Ä ºÐ¾ßÀÇ ¼±µµÀû ¿ÀÇ ¼Ò½º ¶óÀ̺귯¸®ÀÎ ¾ð½½·Î½º´Â AI °³¹ßÀÚ¿Í ¾ÖÈ£°¡µéÀÌ ÆÄÀÎÆ©´× °úÁ¤À» ¼Õ½±°Ô ÁøÇàÇÒ ¼ö ÀÖµµ·Ï À¥ ±â¹Ý »ç¿ëÀÚ Ä£ÈÀû ÀÎÅÍÆäÀ̽º ‘¾ð½½·Î½º ½ºÆ©µð¿À’¸¦ Ãâ½ÃÇß´Ù.
500°³ ÀÌ»óÀÇ AI ¸ðµ¨À» Áö¿øÇÏ´Â ¾ð½½·Î½º ½ºÆ©µð¿À´Â ÈÆ·Ã°ú ÆÄÀÎÆ©´× °úÁ¤À» ȹ±âÀûÀ¸·Î °£¼ÒÈÇÑ´Ù. »ç¿ëÀÚ´Â µ¥ÀÌÅͼ¼Æ®¸¦ ¾÷·ÎµåÇÑ µÚ, ±×·¡ÇÁ ±â¹Ý ĵ¹ö½º¸¦ ¼±ÅÃÇØ °íǰÁú ÇÕ¼º µ¥ÀÌÅ͸¦ »ý¼ºÇϰí Áï½Ã ÆÄÀÎÆ©´× ÀÛ¾÷À» ½ÃÀÛÇÒ ¼ö ÀÖ´Ù. ¾ð½½·Î½º ½ºÆ©µð¿À´Â ¾çÀÚÈµÈ ·Î¿ì ·©Å© ¾î´ðÅ×À̼Ç(quantized low-rank adaptation) ¶Ç´Â ·Î¿ì ·©Å© ¾î´ðÅ×À̼Ç(low-rank adaptation)Àº ¹°·Ð, Àüü ÆÄÀÎÆ©´×±îÁö ¸ðµÎ Áö¿øÇÑ´Ù. »ç¿ëÀÚ´Â ¸ðµ¨ÀÌ ÆÄÀÎÆ©´×µÇ´Â µ¿¾È ÀÛ¾÷ ÁøÇà »óȲÀ» ½Ç½Ã°£À¸·Î ¸ð´ÏÅ͸µÇÏ°í ½Ã°¢ÈÇÒ ¼ö ÀÖ´Ù. ±×´ÙÀ½ ¿øÇÏ´Â ÇÁ·¹ÀÓ¿öÅ©·Î ¸ðµ¨À» ³»º¸³» °°Àº À¥ ¾Û ¾È¿¡¼ °ð¹Ù·Î ´ëȸ¦ ³ª´©¸ç ¼º´ÉÀ» È®ÀÎÇØ º¼ ¼ö ÀÖ´Ù.
¾ð½½·Î½º ½ºÆ©µð¿ÀÀÇ »õ·Î¿î ÀÎÅÍÆäÀ̽º´Â ¸ÂÃãÇü Æ¯È GPU Ä¿³ÎÀ» žÀçÇØ ÈÆ·Ã ¼Óµµ¸¦ ÃÖ´ë 2¹è ³ôÀ̰í VRAM »ç¿ë·®À» ÃÖ´ë 70%±îÁö Àý°¨ÇÏ´Â ¾ð½½·Î½º ¶óÀ̺귯¸®¸¦ ±â¹ÝÀ¸·Î ±¸ÃàµÆ´Ù. ´öºÐ¿¡ ½Å±Ô »ç¿ëÀڵ鵵 ¿£ºñµð¾Æ RTX GPU¿Í DGX ½ºÆÄÅ©ÀÇ ¼º´ÉÀ» Áï½Ã ÃÖ´ë·Î Ȱ¿ëÇÒ ¼ö ÀÖ´Ù.
¾ð½½·Î½º ½ºÆ©µð¿À´Â ÇöÀç »ç¿ë °¡´ÉÇϸç, ³×¸ðÆ®·Ð 3 ³ª³ë 4B¿Í Å¥¿ø 3.5 ½Å±Ô ¸ðµ¨À» Áö¿øÇÑ´Ù. |