IBMÀº ¿À´Ã ÀÚ»ç °Å´ë¾ð¾î¸ðµ¨(LLM) Á¦Ç°±ºÀÇ Â÷¼¼´ë ¹öÀüÀÎ ±×·¡´ÏÆ®(Granite) 3.2¸¦ Ãâ½ÃÇß´Ù. ±×·¡´ÏÆ®´Â ÀÛ°í È¿À²ÀûÀÌ¸ç ½Ç¿ëÀûÀÎ ±â¾÷¿ë ÀΰøÁö´É(AI)À» Á¦°øÇØ ½ÇÁúÀûÀÎ ºñÁî´Ï½º È¿°ú¸¦ âÃâÇϱâ À§ÇÑ IBMÀÇ Áö¼ÓÀûÀÎ ³ë·ÂÀÌ ´ã±ä ¼Ö·ç¼ÇÀÌ´Ù.
±×·¡´ÏÆ® 3.2 ¸ðµ¨Àº Çã±ë ÆäÀ̽º(Hugging Face)¿¡¼ Çã¿ëµÇ´Â ¾ÆÆÄÄ¡ 2.0 ¶óÀ̼±½º¿¡ µû¶ó »ç¿ëÇÒ ¼ö ÀÖ´Ù. ÀϺΠ¸ðµ¨µéÀº IBM ¿Ó½¼x.ai(IBM watsonx.ai), ¿Ã¶ó¸¶(Ollama), ¸®Çø®ÄÉÀÌÆ®(Replicate), LM ½ºÆ©µð¿À¿¡¼ ¿À´Ã Áï½Ã »ç¿ë°¡´ÉÇϸç. °ð ·¹µåÇÞ ¿£ÅÍÇÁ¶óÀÌÁî ¸®´ª½º(RHEL) AI 1.5¿¡¼µµ Á¦°øµÅ ±â¾÷°ú ¿ÀÇ ¼Ò½º Ä¿¹Â´ÏƼ¿¡ »õ·Î¿î ±â´ÉÀ» Á¦°øÇÒ ¿¹Á¤ÀÌ´Ù. ÁÖ¿ä ±â´ÉÀº ´ÙÀ½°ú °°´Ù:
¹®¼ Çؼ® ÀÛ¾÷À» À§ÇÑ »õ·Î¿î ºñÀü ¾ð¾î ¸ðµ¨(VLM, vision language model: À̹ÌÁö¿Í ÅؽºÆ®¸¦ ¸ðµÎ ó¸®Çϵµ·Ï ºñÀü ¸ðµ¨°ú ¾ð¾î ¸ðµ¨ÀÇ ±â´ÉÀ» °áÇÕÇÑ °í±Þ AI ¸ðµ¨)·Î, Çʼö ¿£ÅÍÇÁ¶óÀÌÁî º¥Ä¡¸¶Å©ÀÎ DocVQA, ChartQA, AI2D ¹× OCRBench[1]¿¡¼ ±âÁ¸ ´ëÇü ¸ðµ¨ÀÎ ¶ó¸¶ 3.2 11B ¹× ÇȽºÆ®¶ö 12B¿Í µ¿µîÇϰųª ±× ÀÌ»óÀÇ ¼º´ÉÀ» ÀÔÁõÇß´Ù. IBMÀº dzºÎÇÑ ÇнÀ µ¥ÀÌÅÍ»Ó ¾Æ´Ï¶ó ÀÚü ¿ÀÇ ¼Ò½º µµÅ¬¸µ(Docling) µµ±¸¸¦ È°¿ëÇØ 8,500¸¸ °³ÀÇ PDF¸¦ ó¸®ÇÏ°í 2,600¸¸ °³ÀÇ ÇÕ¼º Áú¹®-´äº¯ Á¶ÇÕÀ» »ý¼ºÇØ º¹ÀâÇÑ ¹®¼ Áß½ÉÀÇ ¾÷¹«¸¦ ó¸®ÇÏ´Â VLMÀÇ ´É·ÂÀ» Çâ»ó½ÃÄ×´Ù.
3.2 2B ¹× 8B ¸ðµ¨¿¡¼ Á¦°øµÇ´Â Çâ»óµÈ Ãß·ÐÀ» À§ÇÑ ‘¿¬¼âÀû »ç°í(Chain of thought)’ ±â´ÉÀ¸·Î, Ãß·Ð ±â´ÉÀ» È°¼ºÈÇϰųª ºñÈ°¼ºÈÇØ È¿À²¼ºÀ» ÃÖÀûÈÇÒ ¼ö ÀÖ´Ù. ÀÌ ±â´ÉÀ» ÅëÇØ 8B ¸ðµ¨Àº ´Ù¸¥ °÷ÀÇ[2] ¾ÈÀü¼ºÀ̳ª ¼º´É ÀúÇÏ ¾øÀÌ ¾Æ·¹³ªÇϵå(ArenaHard) ¹× ¾ËÆÄÄ«À̺§(AlpacaEval)°ú °°Àº ÀνºÆ®·°¼Ç ÃßÁ¾ º¥Ä¡¸¶Å©¿¡¼ ÀÌÀü ¸ðµ¨º¸´Ù µÎ ÀÚ¸´¼ö °³¼±À» ´Þ¼ºÇß´Ù. ¶Ç, ±×·¡´ÏÆ® 3.2 8B ¸ðµ¨ÀÇ °æ¿ì »õ·Î¿î Ãß·Ð È®Àå(inference scaling) ¹æ¹ýÀ¸·Î AIME2024 ¹× MATH500°ú °°Àº ¼öÇÐ Ãß·Ð º¥Ä¡¸¶Å©¿¡¼ Ŭ·Îµå 3.5-¼Ò³Ý ¶Ç´Â GPT-4o¿Í °°Àº ´ë±Ô¸ð ¸ðµ¨ÀÇ ¼º´É¿¡ ÇÊÀûÇϵµ·Ï º¸Á¤ °¡´ÉÇÏ´Ù.[3]
±âÁ¸ ±×·¡´ÏÆ® 3.1 °¡µð¾ð ¸ðµ¨ÀÇ ¼º´ÉÀ» À¯ÁöÇÏ¸é¼ Å©±â¸¦ 30% ÁÙÀÎ ±×·¡´ÏÆ® °¡µð¾ð(Granite Guardian) ¾ÈÀü ¸ðµ¨ÀÇ ¼ÒÇüÈ ¹öÀüÀÌ´Ù. 3.2 ¸ðµ¨¿¡´Â ¾ÈÀü ¸ð´ÏÅ͸µÀÇ ¸ðÈ£¼ºÀ» ÀνÄÇÏ°í, º¸´Ù Á¤±³ÇÑ À§Çè Æò°¡¸¦ Á¦°øÇÏ´Â ¾ð¾îÈµÈ ½Å·Úµµ(verbalized confidence)¶ó´Â »õ·Î¿î ±â´ÉÀÌ µµÀԵƴÙ.
±×·¡´ÏÆ® 3.2´Â ±â¾÷À» À§ÇÑ ÀÛ°í ½Ç¿ëÀûÀÎ AI¸¦ Á¦°øÇϱâ À§ÇÑ IBMÀÇ Æ÷Æ®Æú¸®¿À¿Í Àü·«ÀÇ ÁøÈ¿¡ ÀÖ¾î Áß¿äÇÑ ÁøÀüÀ» ÀÌ·ç¾ú´Ù. ¿¹¸¦ µé¾î, Ãß·ÐÀ» À§ÇÑ '¿¬¼âÀû »ç°í' Á¢±Ù ¹æ½ÄÀº °·ÂÇÏÁö¸¸, ¸ðµç ÀÛ¾÷¿¡ ÇÊ¿äÇÑ °ÍÀº ¾Æ´Ï¸ç »ó´çÇÑ ÄÄÇ»Æà ¼º´ÉÀÌ ÇÊ¿äÇÏ´Ù. ÀÌ¿¡ IBMÀº ÇÁ·Î±×·¡¹Ö ¹æ½ÄÀ¸·Î '¿¬¼âÀû »ç°í'¸¦ È°¼ºÈ ¶Ç´Â ºñÈ°¼ºÈÇÒ ¼ö ÀÖ´Â ±â´ÉÀ» µµÀÔÇß´Ù. °£´ÜÇÑ ÀÛ¾÷ÀÇ °æ¿ì ÀÌ ¸ðµ¨Àº Ãß·Ð ¾øÀÌ ÀÛµ¿ÇϹǷΠºÒÇÊ¿äÇÑ ¿¬»ê ºÎÇϸ¦ ÁÙÀÏ ¼ö ÀÖ´Ù. ¶Ç, ±×·¡´ÏÆ® 8B ¸ðµ¨Àº Ãß·Ð È®Àå°ú °°Àº ´Ù¸¥ Ãß·Ð ±â¹ýÀ» ÅëÇØ Ç¥ÁØ ¼öÇÐ Ãß·Ð º¥Ä¡¸¶Å©¿¡¼ º¸´Ù ±Ô¸ð°¡ Å« ¸ðµ¨ÀÇ ¼º´É°ú µ¿µîÇϰųª À̸¦ ´É°¡ÇÏ´Â °ÍÀ¸·Î ³ªÅ¸³µ´Ù. Ãß·Ð È®Àå °°Àº ¹ßÀüµÈ ¹æ¹ýÀº IBM ¿¬±¸ÆÀÀÇ ÁÖ¿ä °ü½É ºÐ¾ß´Ù.[4]
IBMÀº ±×·¡´ÏÆ® 3.2 ÀνºÆ®·°Æ®, ºñÀü ¹× °¡µå·¹ÀÏ ¸ðµ¨°ú ÇÔ²² ÃÖ´ë 2³â ÈÄÀÇ ¹Ì·¡±îÁö Àå±â ¿¹ÃøÇÒ ¼ö ÀÖ´Â ±â´ÉÀ» °®Ãá Â÷¼¼´ë ½Ã°è¿ ¸ðµ¨ÀΠŸÀÌ´ÏŸÀӹͼ(TTM, TinyTimeMixers) ¸ðµ¨(1000¸¸ °³ ¹Ì¸¸ÀÇ ¸Å°³º¯¼ö)À» Ãâ½ÃÇÑ´Ù. ÀÌ´Â ±ÝÀ¶ ¹× °æÁ¦ µ¿Çâ, °ø±Þ¸Á ¼ö¿ä ¿¹Ãø, À¯Åë ¾÷°èÀÇ °èÀýº° Àç°í °èȹ µî Àå±âÀûÀÎ Æ®·»µå ºÐ¼®¿¡ °·ÂÇÑ µµ±¸°¡ µÉ °ÍÀÌ´Ù.
IBM AI ¿¬±¸ ´ã´ç ½º¸®¶÷ ¶ó°¡¹Ý(Sriram Raghavan) ºÎ»çÀåÀº “´ÙÀ½ AI ½Ã´ë´Â ±â¾÷ÀÌ °úµµÇÑ ÄÄÇ»Æà ºñ¿ë ¾øÀ̵µ °·ÂÇÑ ¼º°ú¸¦ ´Þ¼ºÇÒ ¼ö ÀÖ´Â È¿À²¼º, ÅëÇÕ °¡´É¼º, ½Ç¿ë¼ºÀÌ ÈµÎ°¡ µÉ °Í”À̶ó¸ç, “°³¹æÇü ¼Ö·ç¼Ç¿¡ ÁßÁ¡À» µÐ IBMÀÇ ÃֽŠ±×·¡´ÏÆ® ¸ðµ¨Àº ¿À´Ã³¯ÀÇ ±â¾÷µéÀÇ AI Á¢±Ù¼º, ºñ¿ë È¿À²¼º, AI ÀÚüÀÇ °¡Ä¡¸¦ ³ôÀ̴µ¥ ÀÖ¾î µµ¿òÀ» Áá´Ù°í »ý°¢ÇÑ´Ù”°í ¸»Çß´Ù.
|