±Û·Î¹ú ¿ÀǼҽº ¼Ö·ç¼Ç ¼±µµ±â¾÷ ·¹µåÇÞ(Red Hat)ÀÌ ¿£ÅÍÇÁ¶óÀÌÁî AI Ç÷§ÆûÀÇ ¾÷±×·¹ÀÌµå ¹öÀüÀÎ ·¹µåÇÞ AI 3(Red Hat AI 3)¸¦ Ãâ½ÃÇß´Ù°í ¿À´Ã ¹ßÇ¥Çß´Ù. ÇØ´ç Ç÷§ÆûÀº ·¹µåÇÞ AI ÀÎÆÛ·±½º ¼¹ö (Red Hat AI Inference Server), ·¹µåÇÞ ¿£ÅÍÇÁ¶óÀÌÁî ¸®´ª½º AI (Red Hat Enterprise Linux AI, ÀÌÇÏ RHEL AI), ·¹µåÇÞ ¿ÀǽÃÇÁÆ® AI (Red Hat OpenShift AI)ÀÇ ÃֽŠÇõ½Å ±â¼úÀ» ÅëÇÕÇÏ¿© ´ë±Ô¸ð °í¼º´É AI Ãß·ÐÀÇ º¹À⼺À» ´Ü¼øÈÇØ ±â¾÷ÀÌ PoC(Proofs of Concept)¿¡¼ ÇÁ·Î´ö¼Ç ´Ü°è·Î ¿öÅ©·Îµå¸¦ º¸´Ù ½±°Ô ÀüȯÇϰí AI ±â¹Ý ¾ÖÇø®ÄÉÀÌ¼Ç Çù¾÷ °³¼±À» Áö¿øÇÑ´Ù.
±â¾÷µéÀÌ AI ½ÇÇè ´Ü°è¸¦ ³Ñ¾î¼¸é¼ µ¥ÀÌÅÍ ÇÁ¶óÀ̹ö½Ã, ºñ¿ë °ü¸®, ´Ù¾çÇÑ ¸ðµ¨ °ü¸® µî »ó´çÇÑ ³°ü¿¡ Á÷¸éÇϰí ÀÖ´Ù. ¸Å»çÃß¼¼Ã÷ °ø°ú´ëÇб³(Massachusetts Institute of Technology) NANDA ÇÁ·ÎÁ§Æ®ÀÇ "»ý¼ºÇü AI °ÝÂ÷: ºñÁî´Ï½º ¼Ó AI ÇöȲ (The GenAI Divide: State of AI in Business)" º¸°í¼¿¡ µû¸£¸é ¾à 95%ÀÇ Á¶Á÷ÀÌ ¾à 400¾ï ´Þ·¯ ±Ô¸ðÀÇ ÅõÀÚ¿¡µµ ºÒ±¸Çϰí ÃøÁ¤ °¡´ÉÇÑ À繫Àû ¼º°ú¸¦ ¾òÁö ¸øÇÏ´Â ÇÁ·Î´ö¼Ç AIÀÇ Çö½ÇÀ» °Á¶ÇÑ´Ù.
·¹µåÇÞ AI 3´Â ÀÌ·¯ÇÑ °úÁ¦¸¦ Á÷Á¢ ÇØ°áÇÏ´Â µ¥ ÃÊÁ¡À» ¸ÂÃ߸ç CIO¿Í IT ¸®´õ°¡ °¡¼Ó ÄÄÇ»ÆÃ ±â¼ú ÅõÀÚ¸¦ ±Ø´ëÈÇÒ ¼ö ÀÖ´Â ÀϰüµÇ°í ÅëÇÕµÈ °æÇèÀ» Á¦°øÇÑ´Ù. À̸¦ ÅëÇØ ±â¾÷Àº ÇÏÀ̺긮µå ¹× ¸ÖƼ º¥´õ ȯ°æ Àü¹Ý¿¡¼ AI ¿öÅ©·Îµå¸¦ ½Å¼ÓÇÏ°Ô È®ÀåÇÏ°í ¹èÆ÷ÇÒ ¼ö ÀÖµµ·Ï ÇÑ´Ù. ¶ÇÇÑ °øÅë Ç÷§Æû »ó¿¡¼ ¿¡ÀÌÀüÆ®¿Í °°Àº Â÷¼¼´ë AI ¿öÅ©·Îµå¿¡ ´ëÇÑ ÆÀ °£ Çù¾÷µµ Çâ»ó½ÃŲ´Ù. °³¹æÇü Ç¥ÁØÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÈ ·¹µåÇÞ AI 3´Â ±â¾÷ÀÌ AI ¿©Á¤ÀÇ ¾î´À ´Ü°è¿¡ ÀÖµç ±×¿¡ ¸Â°Ô Áö¿øÇÏ¸ç µ¥ÀÌÅͼ¾ÅÍ¿¡¼ ÆÛºí¸¯ Ŭ¶ó¿ìµå, ¼Ò¹ö¸° AI ȯ°æ, ¿§Áö¿¡ À̸£±â±îÁö ¸ðµç Çϵå¿þ¾î °¡¼Ó±â¿¡¼ ¾î¶² ¸ðµ¨À̵ç Áö¿øÇÑ´Ù.
ÇнÀ¿¡¼ ½ÇÇàÀ¸·Î: ¿£ÅÍÇÁ¶óÀÌÁî AI Ãß·ÐÀ¸·ÎÀÇ Àüȯ
±â¾÷ÀÌ AI ÀÌ´Ï¼ÅÆ¼ºê¸¦ ÇÁ·Î´ö¼Ç ´Ü°è·Î ÀüȯÇÒ ¶§´Â ÇнÀ ¹× ¸ðµ¨ Æ©´×¿¡¼ ¿£ÅÍÇÁ¶óÀÌÁî AIÀÇ ½ÇÁúÀûÀÎ ½ÇÇà ´Ü°èÀÎ Ãß·ÐÀÌ ÁßÁ¡ÀÌ µÈ´Ù. ·¹µåÇÞ AI 3´Â vLLM ¹× llm-d Ä¿¹Â´ÏƼ ÇÁ·ÎÁ§Æ®¿Í ·¹µåÇÞÀÇ ¸ðµ¨ ÃÖÀûÈ ¿ª·®À» ±â¹ÝÀ¸·Î ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(large language models, ÀÌÇÏ LLM)ÀÇ ÇÁ·Î´ö¼Ç±Þ ¼ºù(production-grade serving)À» Á¦°øÇÔÀ¸·Î½á È®Àå °¡´ÉÇÏ°í ºñ¿ë È¿À²ÀûÀÎ Ãß·ÐÀ» °Á¶ÇÑ´Ù.
CIO°¡ °í°¡ÀÇ Çϵå¿þ¾î °¡¼ÓÀ» ÃÖ´ëÇÑ È°¿ëÇÒ ¼ö ÀÖµµ·Ï ·¹µåÇÞ ¿ÀǽÃÇÁÆ® AI 3.0Àº Äí¹ö³×Ƽ½º¿¡¼ LLMÀÌ ±âº»ÀûÀ¸·Î ½ÇÇàµÇ´Â ¹æ½ÄÀ» ÀçÁ¤ÀÇÇÏ´Â llm-dÀ» Á¤½Ä Ãâ½ÃÇß´Ù. llm-d´Â °ËÁõµÈ Äí¹ö³×Ƽ½º ¿ÀÄɽºÆ®·¹À̼ǰú vLLMÀÇ ¼º´ÉÀ» Ȱ¿ëÇØ Áö´ÉÇü ºÐ»ê Ãß·ÐÀ» °¡´ÉÇÏ°Ô ÇÑ´Ù. Äí¹ö³×Ƽ½º °ÔÀÌÆ®¿þÀÌ API Ãß·Ð ÀͽºÅÙ¼Ç(Kubernetes Gateway API Inference Extension), ¿£ºñµð¾Æ ´ÙÀ̳ª¸ð ÀúÁö¿¬ µ¥ÀÌÅÍ Àü¼Û ¶óÀ̺귯¸® (NVIDIA Dynamo low latency data transfer library, ÀÌÇÏ NIXL), ¿ÀǼҽº ¶óÀ̺귯¸® µöEP(DeepEP) MoE(Mixture of Experts)¿Í °°Àº ÁÖ¿ä ¿ÀǼҽº ±â¼úÀ» ÇÔ²² Ȱ¿ëÇÏ¿© ±â¾÷ÀÌ ´ÙÀ½°ú °°Àº ÀÌÁ¡À» ¾òÀ» ¼ö ÀÖµµ·Ï ÇÑ´Ù.
Áö´ÉÇü Ãß·Ð ÀÎ½Ä ¸ðµ¨ ½ºÄÉÁÙ¸µ ¹× ºÐ¸®µÈ ¼ºùÀ» ÅëÇØ ºñ¿ë Àý°¨ ¹× ÀÀ´ä ½Ã°£ °³¼±
Äí¹ö³×Ƽ½º »ó¿¡¼ ´ë±Ô¸ð ¸ðµ¨ ¹èÆ÷¸¦ °£¼ÒÈÇÏ´Â »çÀü ±ÔÁ¤µÈ ¸íÈ®ÇÑ °æ·Î(Well-lit Paths)¸¦ ÅëÇØ ¿î¿µ ´Ü¼ø¼º ¹× ½Å·Ú¼º ±Ø´ëÈ
¿£ºñµð¾Æ, AMD µî ´Ù¾çÇÑ Çϵå¿þ¾î °¡¼Ó±â¿¡ °ÉÃÄ LLM Ãß·ÐÀ» ¹èÆ÷ÇÒ ¼ö ÀÖ´Â Å©·Î½º Ç÷§Æû Áö¿øÀ» ÅëÇØ À¯¿¬¼º ±Ø´ëÈ
llm-d´Â vLLMÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÇ¾î ´ÜÀÏ ³ëµå °í¼º´É Ãß·Ð ¿£Áø¿¡¼ Äí¹ö³×Ƽ½º¿Í ±ä¹ÐÈ÷ ÅëÇÕµÇ°í ¿¹Ãø °¡´ÉÇÑ ¼º´É, ÃøÁ¤ °¡´ÉÇÑ ROI, È¿°úÀûÀÎ ÀÎÇÁ¶ó °èȹÀ» °¡´ÉÇÏ°Ô Çϵµ·Ï ¼³°èµÈ Àϰü¼º ÀÖ°í È®Àå °¡´ÉÇÑ ºÐ»êÇü ¼ºù ½Ã½ºÅÛÀ¸·Î È®ÀåÇß´Ù. ¸ðµç °³¼± »çÇ×Àº °¡º¯¼ºÀÌ ³ôÀº LLM ¿öÅ©·Îµå ó¸® ¹× MoE ¸ðµ¨°ú °°Àº ´ë±Ô¸ð ¸ðµ¨ ¼ºùÀÇ °úÁ¦¸¦ Á÷Á¢ÀûÀ¸·Î ÇØ°áÇÑ´Ù.
Çù¾÷Çü AI¸¦ À§ÇÑ ÅëÇÕ Ç÷§Æû
·¹µåÇÞ AI 3´Â ÇÁ·Î´ö¼Ç ´Ü°è¿¡¼ »ç¿ë °¡´ÉÇÑ »ý¼ºÇü AI ¼Ö·ç¼Ç ±¸ÃàÀ» À§ÇÑ Çù¾÷ Áß½ÉÀÇ ÅëÇյǰí À¯¿¬ÇÑ °æÇèÀ» Á¦°øÇÑ´Ù. ÀÌ´Â Ç÷§Æû ¿£Áö´Ï¾î¿Í AI ¿£Áö´Ï¾î°¡ AI Àü·«À» ½ÇÇàÇÒ ¼ö ÀÖ´Â ´ÜÀÏ Ç÷§ÆûÀ» ÅëÇØ ÆÀ °£ Çù¾÷À» ÃËÁøÇÏ°í ¿öÅ©Ç÷ο츦 ÅëÇÕÇÔÀ¸·Î½á ½ÇÁúÀûÀÎ °¡Ä¡¸¦ Á¦°øÇϵµ·Ï ¼³°èµÇ¾ú´Ù. PoC(proof-of-concept)¿¡¼ ÇÁ·Î´ö¼Ç ´Ü°è·Î È®ÀåÇÏ´Â µ¥ ÇÊ¿äÇÑ »ý»ê¼º°ú È¿À²¼ºÀ» Áö¿øÇÏ´Â ½Å±Ô ±â´ÉÀº ´ÙÀ½°ú °°´Ù.
¼ºñ½ºÇü ¸ðµ¨ (Model as a Service, ÀÌÇÏ MaaS) - ºÐ»ê Ãß·ÐÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÇ¾î IT ÆÀÀÌ ÀÚü MaaS Á¦°øÀڷμ Áß¾Ó¿¡¼ °øÅë ¸ðµ¨À» ¼ºùÇϸç, AI °³¹ßÀÚ¿Í AI ¾ÖÇø®ÄÉÀ̼ÇÀÌ ¿Âµð¸Çµå ¹æ½ÄÀ¸·Î Á¢±ÙÇÒ ¼ö ÀÖ°Ô ÇÑ´Ù. À̸¦ ÅëÇØ ºñ¿ë °ü¸®¸¦ °³¼±ÇÏ°í º¸¾È¼º ¶Ç´Â µ¥ÀÌÅÍ ¹®Á¦·Î ÀÎÇØ ÆÛºí¸¯ AI ¼ºñ½º¿¡¼ ½ÇÇàÇÒ ¼ö ¾ø´Â »ç¿ë »ç·Ê¸¦ Áö¿øÇÑ´Ù.
AI Çãºê - Ç÷§Æû ¿£Áö´Ï¾î°¡ ±âº» AI ÀÚ»êÀ» Ž»ö, ¹èÆ÷ ¹× °ü¸®ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. °ËÁõµÇ°í ÃÖÀûÈµÈ »ý¼ºÇü AI ¸ðµ¨À» Æ÷ÇÔÇÑ ¸ðµ¨ÀÇ Å¥·¹ÀÌ¼ÇµÈ Ä«Å»·Î±×, ¸ðµ¨ ¶óÀÌÇÁ»çÀÌŬ °ü¸®¿ë ·¹Áö½ºÆ®¸®, ·¹µåÇÞ ¿ÀǽÃÇÁÆ® AI¿¡¼ ½ÇÇàµÇ´Â ¸ðµç AI ÀÚ»êÀ» ±¸¼ºÇÏ°í ¸ð´ÏÅ͸µÇÏ´Â ¹èÆ÷ ȯ°æÀ» °®Ãá Áß¾Ó Çãºê¸¦ Á¦°øÇÑ´Ù.
»ý¼ºÇü AI ½ºÆ©µð¿À (Gen AI studio) - AI ¿£Áö´Ï¾î°¡ ¸ðµ¨°ú »óÈ£ÀÛ¿ëÇÏ°í ½Å±Ô »ý¼ºÇü AI ¾ÖÇø®ÄÉÀ̼ÇÀ» ½Å¼ÓÇÏ°Ô ÇÁ·ÎÅäŸÀÌÇÎÇÒ ¼ö ÀÖ´Â ½Ç½À ȯ°æÀ» Á¦°øÇÑ´Ù. AI ÀÚ»ê ¿£µåÆ÷ÀÎÆ® ±â´ÉÀ» ÅëÇØ ¿£Áö´Ï¾î´Â »ç¿ë °¡´ÉÇÑ ¸ðµ¨°ú MCP(Multi-cloud Container Platform) ¼¹ö¸¦ ½±°Ô ¹ß°ßÇÏ°í »ç¿ëÇÒ ¼ö ÀÖÀ¸¸ç, ÀÌ´Â ¸ðµ¨ÀÌ ¿ÜºÎ µµ±¸¿Í »óÈ£ÀÛ¿ëÇÏ´Â ¹æ½ÄÀ» °£¼ÒÈÇÑ´Ù. ³»ÀåµÈ Ç÷¹À̱׶ó¿îµå´Â ¸ðµ¨À» ½ÇÇèÇϰí ÇÁ·ÒÇÁÆ®¸¦ Å×½ºÆ®Çϸç, ê ¹× °Ë»ö Áõ° »ý¼º (RAG)°ú °°Àº »ç¿ë »ç·Ê¸¦ À§ÇØ ¸Å°³º¯¼ö¸¦ Á¶Á¤ÇÒ ¼ö ÀÖ´Â »óÈ£ÀÛ¿ëÇü ½ºÅ×ÀÌÆ®¸®½º(stateless) ȯ°æÀ» Á¦°øÇÑ´Ù.
½Å±Ô ·¹µåÇÞ °ËÁõ ¹× ÃÖÀûÈ ¸ðµ¨ - ·¹µåÇÞÀº °³¹ß °úÁ¤À» ´Ü¼øÈÇϱâ À§ÇØ ½Å±Ô °ËÁõ ¹× ÃÖÀûÈ ¸ðµ¨À» Æ÷ÇÔÇß´Ù. ¿©±â¿¡´Â ¿ÀÇÂAI(OpenA)IÀÇ gpt-oss, µö½ÃÅ©(DeepSeek) R1°ú °°Àº Àαâ ÀÖ´Â ¿ÀǼҽº ¸ðµ¨°ú À½¼º-ÅØ½ºÆ® º¯È¯À» À§ÇÑ À§½ºÆÛ(Whisper), À½¼º Áö¿ø ¿¡ÀÌÀüÆ®¸¦ À§ÇÑ º¹½ºÆ®¶ö ¹Ì´Ï(Voxtral Mini)¿Í °°Àº Æ¯ÈµÈ ¸ðµ¨ÀÌ Æ÷ÇԵȴÙ.
Â÷¼¼´ë AI ¿¡ÀÌÀüÆ®¸¦ À§ÇÑ ±â¹Ý ±¸Ãà
AI ¿¡ÀÌÀüÆ®´Â ¾ÖÇø®ÄÉÀÌ¼Ç ±¸Ãà ¹æ½ÄÀ» Çõ½ÅÇÒ Àü¸ÁÀÌ¸ç º¹ÀâÇϰí ÀÚÀ²ÀûÀÎ ¿öÅ©Ç÷οì´Â °·ÂÇÑ Ãß·Ð ¼º´ÉÀ» ¿ä±¸ÇÑ´Ù. ·¹µåÇÞ ¿ÀǽÃÇÁÆ® AI 3.0Àº È®Àå °¡´ÉÇÑ ¿¡ÀÌÀüÆ®Çü AI ½Ã½ºÅÛÀÇ ±â¹ÝÀ» ´ÙÁö¸ç, Ãß·Ð ±â´É»Ó¸¸ ¾Æ´Ï¶ó ¿¡ÀÌÀüÆ® °ü¸®¿¡ ÃÊÁ¡À» ¸ÂÃã »õ·Î¿î ±â´É°ú °³¼± »çÇ×À» Æ÷ÇÔÇÑ´Ù.
¿¡ÀÌÀüÆ® »ý¼º ¹× ¹èÆ÷¸¦ °¡¼ÓÈÇϱâ À§ÇØ ·¹µåÇÞÀº ¶ó¸¶ ½ºÅÃ(Llama Stack)±â¹ÝÀÇ ÅëÇÕ API ·¹À̾î(Unified API layer)¸¦ µµÀÔÇØ ¿ÀÇÂAI ȣȯ LLM ÀÎÅÍÆäÀ̽º ÇÁ·ÎÅäÄݰú °°Àº ¾÷°è Ç¥ÁØ¿¡ °³¹ßÀ» ¸ÂÃâ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. ¶ÇÇÑ ·¹µåÇÞÀº º¸´Ù °³¹æÀûÀÌ°í »óÈ£ ¿î¿ë °¡´ÉÇÑ »ýŰ踦 Áö¿øÇϱâ À§ÇØ AI ¸ðµ¨ÀÌ ¿ÜºÎ µµ±¸¿Í »óÈ£ÀÛ¿ëÇÏ´Â ¹æ½ÄÀ» °£¼ÒÈÇÏ´Â ¸ðµ¨ ÄÁÅØ½ºÆ® ÇÁ·ÎÅäÄÝ (Model Context Protocol)À» ¼±µµÀûÀ¸·Î äÅÃÇßÀ¸¸ç ÀÌ´Â ÃֽŠAI ¿¡ÀÌÀüÆ®ÀÇ ÇÙ½É ±â´ÉÀÌ´Ù.
·¹µåÇÞ AI 3´Â ±âÁ¸ ÀνºÆ®·°Æ®·¦(InstructLab) ±â´ÉÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÈ ¸ðµ¨ Ä¿½ºÅ͸¶ÀÌ¡À» À§ÇÑ »õ·Î¿î ¸ðµâ½Ä È®ÀåÇü ŸŶÀ» µµÀÔÇß´Ù. °³¹ßÀÚ¿¡°Ô ´õ ³ôÀº À¯¿¬¼º°ú Á¦¾î±ÇÀ» Á¦°øÇÏ´Â Àü¿ë ÆÄÀ̽ã(Python) ¶óÀ̺귯¸®¸¦ Á¦°øÇÑ´Ù. ÀÌ ÅøÅ¶Àº µ¥ÀÌÅÍ Ã³¸®¸¦ À§ÇÑ µ¶Å¬¸µ(Docling)°ú °°Àº ¿ÀǼҽº ÇÁ·ÎÁ§Æ®¸¦ ±â¹ÝÀ¸·Î Çϸç ÀÌ´Â ºñÁ¤Çü ¹®¼¸¦ AI°¡ ÀÐÀ» ¼ö ÀÖ´Â Çü½ÄÀ¸·Î °£¼ÒÈÇØ¼ º¯È¯ÇÑ´Ù. ¶ÇÇÑ ÇÕ¼º µ¥ÀÌÅÍ »ý¼ºÀ» À§ÇÑ À¯¿¬ÇÑ ÇÁ·¹ÀÓ¿öÅ©¿Í LLM ¹Ì¼¼ Á¶Á¤À» À§ÇÑ ÇнÀ Çãºê°¡ Æ÷ÇԵǾî ÀÖ´Ù. À̸¦ ÅëÇØ AI¿£Áö´Ï¾î´Â °á°ú¸¦ ¸ð´ÏÅ͸µ ¹× °ËÁõÇϰí, ÀÚü µ¥ÀÌÅ͸¦ Ȱ¿ëÇØ ´õ Á¤È®ÇÏ°í °ü·Ã¼º ³ôÀº AI °á°ú¸¦ µµÃâÇÒ ¼ö ÀÖ´Ù.
|