īī¿À°¡ ±¹³» °ø°³ ¸ðµ¨ Áß ÃÖ°í ¼º´ÉÀÇ °æ·® ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨°ú MoE ¸ðµ¨À» ±¹³» ÃÖÃÊ ¿ÀǼҽº·Î °ø°³Çϸç ÀÚü AI ±â¼ú°³¹ß ´É·ÂÀ» ÀçÂ÷ ÀÔÁõÇß´Ù.
īī¿À(´ëÇ¥ÀÌ»ç Á¤½Å¾Æ)´Â 24ÀÏ Çã±ëÆäÀ̽º¸¦ ÅëÇØ ¡ãÀ̹ÌÁö Á¤º¸ ÀÌÇØ ¹× Áö½Ã ÀÌÇà ´É·ÂÀ» °®Ãá °æ·® ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨‘Kanana-1.5-v-3b’¿Í ¡ãMoE(Mixture of Experts) ¾ð¾î¸ðµ¨ ‘Kanana-1.5-15.7b-a3b’¸¦ ¿ÀǼҽº·Î °ø°³Çß´Ù.
Áö³ 5¿ù °ø°³ÇÑ ¾ð¾î¸ðµ¨ Kanana-1.5 4Á¾¿¡ ÀÌ¾î µÎ ´Þ ¸¸¿¡ Ãß°¡ ¸ðµ¨À» ¿ÀǼҽº·Î °ø°³Çϸç, µ¶ÀÚÀû ¸ðµ¨ ¼³°è ±â¹ÝÀÇ ±â¼ú °æÀï·ÂÀ» Áõ¸íÇß´Ù. Á¤ºÎ°¡ ÃßÁøÇÏ´Â ‘µ¶ÀÚ AI ÆÄ¿îµ¥ÀÌ¼Ç ¸ðµ¨ ÇÁ·ÎÁ§Æ®’¿¡ Âü¿©ÇÑ Ä«Ä«¿À´Â ÀÌ·¯ÇÑ ÀÚü ¸ðµ¨ °³¹ß ¿ª·® ¹× īī¿ÀÅå µîÀÇ ´ë±Ô¸ð ¼ºñ½º ¿î¿µ °æÇè µîÀ» Åä´ë·Î Àü ±¹¹ÎÀÇ AI Á¢±Ù¼ºÀ» ³ôÀ̰í, ±¹°¡ AI °æÀï·ÂÀ» °ÈÇϴµ¥ ±â¿©ÇÑ´Ù´Â ¹æÄ§ÀÌ´Ù.
# À̹ÌÁö, ÅØ½ºÆ® ÀÔ·Â ½Ã ÀÚ¿¬¾î·Î ÀÀ´äÇÏ´Â °æ·® ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨... ‘ÇÁ·Ò ½ºÅ©·¡Ä¡(From Scratch)’ ¹æ½ÄÀ¸·Î ÀÚü °³¹ßÇÑ Kanana 1.5 LLM ±â¹ÝÀ¸·Î È®Àå
‘Kanana-1.5-v-3b’´Â ÅØ½ºÆ® »Ó¸¸ ¾Æ´Ï¶ó À̹ÌÁö Á¤º¸µµ ó¸®ÇÒ ¼ö ÀÖ´Â ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨·Î, Áö³ 5¿ù ¸» ¿ÀǼҽº·Î °ø°³ÇÑ Kanana 1.5 ¸ðµ¨À» ±â¹ÝÀ¸·Î Çϰí ÀÖ´Ù. Kanana 1.5´Â ¸ðµ¨ °³¹ßÀÇ Ã³À½ºÎÅÍ ¸¶Áö¸· ´Ü°è±îÁö īī¿ÀÀÇ ÀÚü ±â¼úÀ» ¹ÙÅÁÀ¸·Î ±¸ÃàÇÏ´Â ‘ÇÁ·Ò ½ºÅ©·¡Ä¡(From Scratch)’ ¹æ½ÄÀ¸·Î °³¹ßµÆ´Ù.
¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨ÀÎ ‘Kanana-1.5-v-3b’´Â ÀÌ¿ëÀÚÀÇ Áú¹® Àǵµ¸¦ Á¤È®È÷ ÀÌÇØÇÏ´Â ³ôÀº Áö½Ã ÀÌÇà(instruction following) ¼º´É°ú ¶Ù¾î³ Çѱ¹¾î·¿µ¾î À̹ÌÁö ÀÌÇØ ´É·ÂÀ» º¸À¯ÇÑ °ÍÀÌ Æ¯Â¡ÀÌ´Ù. °æ·® ¸ðµ¨ÀÓ¿¡µµ À̹ÌÁö·Î Ç¥ÇöµÈ Çѱ¹¾î¿Í ¿µ¾î ¹®¼ ÀÌÇØ ´É·ÂÀÌ ±Û·Î¹ú ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨ GPT-4o¿Í °ßÁÙ ¼ö ÀÖÀ» Á¤µµ·Î ¶Ù¾î³ª´Ù.
¶ÇÇÑ, Çѱ¹¾î º¥Ä¡¸¶Å©¿¡¼ À¯»ç »çÀÌÁîÀÇ ±¹³»¿Ü °ø°³ ¸ðµ¨°ú ºñ±³ÇÑ °á°ú ÃÖ°í Á¡¼ö¸¦ ±â·ÏÇß°í, ´Ù¾çÇÑ ¿µ¾î º¥Ä¡¸¶Å©¿¡¼ ÇØ¿Ü ¿ÀǼҽº °ø°³¸ðµ¨°ú ºñ±³ÇßÀ» ¶§µµ À¯»çÇÑ ¼öÁØÀÇ ¼º´ÉÀ» º¸¿´´Ù. Áö½Ã ÀÌÇà ´É·Â º¥Ä¡¸¶Å©¿¡¼´Â ±¹³» °ø°³µÈ À¯»çÇÑ ±Ô¸ðÀÇ ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨ ´ëºñ 128% ¼öÁØÀÇ ¼º´ÉÀ» ±â·ÏÇß´Ù.
īī¿À´Â Àΰ£ ¼±È£ ¹Ý¿µ ÇнÀ(Human Preference Alignment Training)°ú Áö½Ä Áõ·ù(Knowledge Distillation)¸¦ ÅëÇØ‘Kanana-1.5-v-3b’ÀÇ ¼º´ÉÀ» ±Ø´ëÈÇß´Ù. Áö½Ä Áõ·ù´Â °í¼º´ÉÀÇ ´ëÇü ¸ðµ¨(Teacher Model)·ÎºÎÅÍ ºñ±³Àû ÀÛÀº ¸ðµ¨(Student Model)À» ÇнÀÇÏ´Â ¹æ½ÄÀÌ´Ù. ´Ü¼øÇÑ Á¤´ä »Ó ¾Æ´Ï¶ó ´ëÇü ¸ðµ¨ÀÇ ¿¹Ãø È®·ü ºÐÆ÷±îÁö ÇнÀ¿¡ ¹Ý¿µÇÔÀ¸·Î½á ÀÛÀº ¸ðµ¨ÀÌ ´õ Á¤±³Çϰí ÀϹÝÈµÈ ¿¹Ãø ´É·ÂÀ» °®Ãßµµ·Ï µ½´Â ±â¼ú·Î, À̸¦ ÅëÇØ »ó´ëÀûÀ¸·Î °æ·®È µÈ ¸ðµ¨ ±¸Á¶ÀÓ¿¡µµ Á¤È®µµ³ª ¾ð¾î ÀÌÇØ µîÀÇ ´É·Â¿¡¼ ´ëÇü ¸ðµ¨ÀÇ ³ôÀº ¼º´É¿¡ ±ÙÁ¢Çϰųª, À̸¦ ¶Ù¾î ³ÑÀ» ¼ö ÀÖ´Â ´É·ÂÀ» ¹ßÈÖÇϵµ·Ï µ½´Â´Ù.
‘Kanana-1.5-v-3b’´Â °æ·® ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨ÀÇ °Á¡À» Åä´ë·Î ¡ãÀ̹ÌÁö ¹× ±ÛÀÚ ÀÎ½Ä ¡ãµ¿È ¹× ½Ã âÀÛ ¡ã±¹³» ¹®ÈÀ¯»ê ¹× °ü±¤Áö ÀÎ½Ä ¡ãµµÇ¥ ÀÌÇØ ¡ã¼öÇÐ ¹®Á¦Ç®ÀÌ µî ¿©·¯ ºÐ¾ß¿¡¼ À¯¿¬ÇÏ°Ô È°¿ëÇÒ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¾î, Àå¼Ò »çÁø°ú ÇÔ²² “ÀÌ »çÁøÀÌ ÃÔ¿µµÈ Àå¼Ò¿¡ ´ëÇØ °£´ÜÈ÷ ¼³¸íÇØÁà”¶ó°í Áú¹®ÇÏ¸é “ÀÌ »çÁøÀº ¼¿ï û°èõÀ» ¹è°æÀ¸·Î Çϰí ÀÖ½À´Ï´Ù”¿Í °°ÀÌ ±¹³» Áö¿ª¿¡ ´ëÇÑ ³ôÀº ÀνķÂÀ» ¹ÙÅÁÀ¸·Î Á¤È®ÇÑ ´äº¯À» Á¦°øÇÑ´Ù. À̹ÌÁö °Ë»ö, ÄÜÅÙÃ÷ ºÐ·ù µî ½Ç½Ã°£¼º°ú È¿À²¼ºÀÌ ¿ä±¸µÇ´Â ºÐ¾ß¿¡¼ È¿°úÀû »ç¿ëÀÌ °¡´ÉÇÏ´Ù.
īī¿À´Â ¸ðµ¨ÀÇ ¼º´É¿¡ ÁýÁßÇÏ´Â ´Ü°è¸¦ ³Ñ¾î AI°¡ »ç¶÷ó·³ »ý°¢Çϰí ÇൿÇÒ ¼ö ÀÖ´Â ¸ÖƼ¸ð´Þ ÀÌÇØ ´É·Â, »ç¿ëÀÚ Áö½Ã ¼öÇà ´É·Â, Ã߷дɷÂÀ» °®Ãßµµ·Ï ¹ßÀü½ÃŰ´Â µ¥ ÁÖ·ÂÇϰí ÀÖ´Ù. ÇϹݱâ Áß¿¡´Â ¿¡ÀÌÀüÆ®Çü AI ±¸Çö¿¡ ÇʼöÀûÀÎ Ãß·Ð ¸ðµ¨ÀÇ ¼º°úµµ °ø°³ÇÒ ¿¹Á¤ÀÌ´Ù.
# Çõ½ÅÀû MoE ¸ðµ¨ ±¸Á¶·Î ºñ¿ë È¿À²¼º°ú ¼º´É µÎ·ç °®Ãç… AI ¸ðµ¨ °³¹ß »õ·Î¿î Æ®·»µå
īī¿À´Â ÀÌ ³¯ ÀϹÝÀûÀÎ ‘¹ÐÁý(Dense)’ ¸ðµ¨°ú Â÷º°ÈµÇ´Â MoE(Mixture of Experts) ±¸Á¶ÀÇ ¾ð¾î¸ðµ¨À» ¿ÀǼҽº·Î ÇÔ²² °ø°³Çß´Ù.
‘MoE’´Â ÀÔ·Â µ¥ÀÌÅÍ Ã³¸® ½Ã ¸ðµç ÆÄ¶ó¹ÌÅͰ¡ ¿¬»ê¿¡ Âü¿©ÇÏ´Â ±âÁ¸ ¸ðµ¨°ú ´Þ¸®, ƯÁ¤ ÀÛ¾÷¿¡ ÃÖÀûÈµÈ ÀϺΠÀü¹®°¡ ¸ðµ¨¸¸ Ȱ¼ºÈµÇ´Â ¹æ½ÄÀ¸·Î È¿À²ÀûÀÎ ÄÄÇ»ÆÃ ÀÚ¿ø Ȱ¿ë°ú ºñ¿ë Àý°¨ÀÌ °Á¡ÀÌ´Ù. ÀÌ·¯ÇÑ ÀåÁ¡ ´ö¿¡ ±Û·Î¹ú ½ÃÀå¿¡¼´Â AI ¸ðµ¨ °³¹ß Æ®·»µå·Î ÀÚ¸®Àâ°í ÀÖ´Ù.
MoE ¾ÆÅ°ÅØÃ³¸¦ Àû¿ëÇÑ ‘Kanana-1.5-15.7b-a3b’´Â Àüü 15.7BÀÇ ÆÄ¶ó¹ÌÅÍ Áß Ãß·Ð ½Ã ¾à 3B ÆÄ¶ó¹ÌÅ͸¸ Ȱ¼ºÈµÇ¾î µ¿ÀÛÇÑ´Ù. īī¿À´Â ¸ðµ¨ÀÇ ÇнÀ ½Ã°£°ú ºñ¿ëÀ» Àý¾àÇϱâ À§ÇØ ÀÚ»çÀÇ 3B ±Ô¸ðÀÇ ¸ðµ¨ ‘Kanana-Nano-1.5-3B’¿¡ ‘¾÷»çÀÌŬ¸µ(Upcycling)’ ¹æ½ÄÀ» Àû¿ëÇØ °³¹ßÇß´Ù. ¾÷»çÀÌŬ¸µÀº ±âÁ¸ ´ÙÃþ ½Å°æ¸Á(MLP, Multi-Layer Perceptron) ·¹À̾ º¹Á¦ÇØ ¿©·¯ Àü¹®°¡ ·¹À̾î·Î º¯È¯ÇÏ´Â ¹æ½ÄÀ¸·Î, ¸ðµ¨À» óÀ½ºÎÅÍ °³¹ßÇÏ´Â ¹æ½Ä¿¡ ºñÇØ È¿À²ÀûÀÌ´Ù. Ȱ¼ºÈµÇ´Â ÆÄ¶ó¹ÌÅͰ¡ 3B¿¡ ºÒ°úÇÏÁö¸¸ ¼º´ÉÀº ‘Kanana-1.5-8B’¿Í µ¿µîÇϰųª »óȸÇÏ´Â ¼öÁØÀ» ±â·ÏÇß´Ù.
īī¿ÀÀÇ MoE ¸ðµ¨Àº °í¼º´É AI ÀÎÇÁ¶ó¸¦ Àúºñ¿ëÀ¸·Î ±¸ÃàÇϰíÀÚ ÇÏ´Â ±â¾÷À̳ª ¿¬±¸ °³¹ßÀڵ鿡°Ô ½Ç¿ëÀûÀÎ µµ¿òÀ» Á¦°øÇÒ ¼ö ÀÖ´Ù.ƯÈ÷ Ãß·Ð °úÁ¤¿¡¼ Á¦ÇÑµÈ ÆÄ¶ó¹ÌÅ͸¸ »ç¿ëÇÏ´Â ±¸Á¶Àû Ư¼º ´öºÐ¿¡ Àúºñ¿ë, °íÈ¿À² ¼ºñ½º ±¸Çö¿¡ À¯¸®ÇØ È°¿ëµµ°¡ ³ô´Ù.
īī¿À´Â À̹ø °æ·® ¸ÖƼ¸ð´Þ ¾ð¾î¸ðµ¨°ú MoE ¸ðµ¨ÀÇ ¿ÀǼҽº °ø°³¸¦ ÅëÇØ AI ¸ðµ¨ »ýŰ迡 »õ·Î¿î ±âÁØÀ» Á¦½ÃÇϰí, ´õ ¸¹Àº ¿¬±¸ÀÚ¿Í °³¹ßÀÚ°¡ È¿À²ÀûÀÌ°í °·ÂÇÑ AI ±â¼úÀ» ÀÚÀ¯·Ó°Ô Ȱ¿ëÇÒ ¼ö ÀÖ´Â ±â¹ÝÀ» ¸¶·ÃÇØ °¥ °èȹÀÌ´Ù. ÀÌ¿Í ´õºÒ¾î ÀÚü ±â¼ú ±â¹ÝÀÇ ¸ðµ¨À» Áö¼ÓÀûÀ¸·Î °íµµÈÇϰí, ¸ðµ¨ ½ºÄÉÀϾ÷À» ÅëÇØ ±Û·Î¹ú Ç÷¡±×½Ê ¼öÁØÀÇ ÃÊ°Å´ë ¸ðµ¨ °³¹ß¿¡ µµÀüÇÔÀ¸·Î½á ±¹³» AI »ýŰèÀÇ ÀÚ¸³¼º°ú ±â¼ú °æÀï·Â °È¿¡ ±â¿©ÇÒ °èȹÀÌ´Ù.
īī¿À ±èº´ÇÐ Ä«³ª³ª ¼º°ú¸®´õ´Â “À̹ø ¿ÀǼҽº °ø°³´Â ºñ¿ë È¿À²¼º°ú ¼º´ÉÀ̶ó´Â À¯ÀǹÌÇÑ ±â¼ú °³¹ßÀÇ ¼º°ú¸¦ °ÅµÐ °ÍÀ¸·Î, ´Ü¼øÇÑ ¸ðµ¨ ¾ÆÅ°ÅØÃ³ÀÇ Áøº¸¸¦ ³Ñ¾î ¼ºñ½º Àû¿ë°ú ±â¼ú ÀÚ¸³À̶ó´Â µÎ °¡Áö Ãø¸éÀÇ ¸ñÇ¥¿¡ ºÎÇÕÇÏ´Â °á°ú¹°”À̶ó°í ¸»Çß´Ù.
ÇÑÆí, īī¿À´Â Áö³ÇØ ÀÚü °³¹ß AI ¸ðµ¨ ‘Ä«³ª³ª(Kanana)’ÀÇ ¶óÀξ÷À» °ø°³ÇÑ ÀÌ·¡, ´Ù¾çÇÑ ¸ðµ¨µéÀÇ ¼º´É°ú °³¹ß±â¸¦ °ø°³ÇؿԴÙ. ´õºÒ¾î Áö³ 2¿ù ¸» ¿ÀǼҽº·Î °ø°³ÇÑ ÀÚü °³¹ß ¸ðµ¨·ÎºÎÅÍ ¼º´ÉÀÌ ÇÑÃþ Çâ»óµÈ Ä«³ª³ª ¾ð¾î¸ðµ¨ 4Á¾À» 5¿ù ¿ÀǼҽº·Î °ø°³ÇÑ ¹Ù ÀÖ´Ù.ƯÈ÷, ±¹³» AI »ýÅÂ°è ±â¿©¸¦ À§ÇØ »ó¾÷Àû Ȱ¿ë±îÁö °¡´ÉÇÑ ¾ÆÆÄÄ¡ 2.0 ¶óÀ̼¾½º¸¦ Àû¿ëÇØ ¿¬±¸ÀÚ, ½ºÅ¸Æ®¾÷ µîÀÌ ±¹»ê LLMÀ» ÀÚÀ¯·Ó°Ô ½ÇÇèÇÏ°í ¼ºñ½º ÇÒ ¼ö ÀÖ´Â Åä´ë¸¦ Á¦°øÇß´Ù. |