·¹µåÇÞÀº AWS »ó¿¡¼ ·¹µåÇÞ AI¿Í AWS AI ½Ç¸®ÄÜÀ» ÅëÇØ ¿£ÅÍÇÁ¶óÀÌÁî±Þ »ý¼ºÇü AI¸¦ Áö¿øÇϱâ À§ÇØ ¿À´Ã ¾Æ¸¶Á¸À¥¼ºñ½º(Amazon Web Services, AWS)¿ÍÀÇ Çù¾÷À» È®´ëÇÑ´Ù°í ¹ßÇ¥Çß´Ù. À̹ø Çù¾÷À» ÅëÇØ ·¹µåÇÞÀº IT ÀÇ»ç°áÁ¤ÀÚµéÀÌ ±â¹Ý Çϵå¿þ¾î¿Í °ü°è¾øÀÌ °í¼º´É·°íÈ¿À² AI Ãß·ÐÀ» ´ë±Ô¸ð·Î ½ÇÇàÇÒ ¼ö ÀÖµµ·Ï À¯¿¬¼ºÀ» Á¦°øÇÏ´Â µ¥ ÁýÁßÇÑ´Ù.
»ý¼ºÇü AIÀÇ ºÎ»ó°ú ÀÌ¿¡ µû¸¥ È®Àå °¡´ÉÇÑ AI Ãß·ÐÀÇ Çʿ伺Àº ±â¾÷À¸·Î ÇÏ¿©±Ý IT ÀÎÇÁ¶ó¸¦ Àç°ËÅäÇϵµ·Ï Ã˱¸Çϰí ÀÖ´Ù. ÀÌ¿¡ µû¶ó IDC´Â “2027³â±îÁö Á¶Á÷ÀÇ 40%°¡ ¼º´É ÃÖÀûÈ, ºñ¿ë È¿À²¼º, Ư¼ö ÄÄÇ»ÆÃ¿¡ ´ëÇÑ Áõ°¡ÇÏ´Â ¿ä±¸¸¦ ÃæÁ·Çϱâ À§ÇØ ARM ÇÁ·Î¼¼¼ ¶Ç´Â AI/ML Àü¿ë ĨÀ» Æ÷ÇÔÇÑ ¸ÂÃãÇü ½Ç¸®ÄÜÀ» »ç¿ëÇÒ °Í”À̶ó°í Àü¸Á[1]Çß´Ù. ÀÌ´Â °í¼º´É AI ¾ÖÇø®ÄÉÀ̼ÇÀ» À§ÇØ Ã³¸® ¼º´ÉÀ» Çâ»ó½ÃŰ°í ºñ¿ëÀ» ÃÖ¼ÒÈÇÏ¸ç ´õ ºü¸¥ Çõ½Å Áֱ⸦ °¡´ÉÇÏ°Ô ÇÏ´Â ÃÖÀûÈµÈ ¼Ö·ç¼ÇÀÇ Çʿ伺À» °Á¶ÇÑ´Ù.
·¹µåÇÞ°ú AWSÀÇ Çù¾÷Àº ·¹µåÇÞÀÇ Æ÷°ýÀûÀÎ Ç÷§Æû ¿ª·®°ú AWS Ŭ¶ó¿ìµå ÀÎÇÁ¶ó, ±×¸®°í AI Ĩ¼ÂÀÎ ‘AWS ÀÎÆÛ·±½Ã¾Æ2(AWS Inferentia2)’¿Í ‘AWS Æ®·¹ÀÌ´Ï¿ò3(AWS Trainium3)’À» °áÇÕÇÔÀ¸·Î½á Á¶Á÷ÀÌ Àü¹æÀ§ÀûÀÎ(full-stack) »ý¼ºÇü AI Àü·«À» ±¸ÇöÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. À̹ø Çù¾÷ÀÇ ÁÖ¿ä ³»¿ëÀº ´ÙÀ½°ú °°´Ù.
AWS AI Ĩ ±â¹Ý ·¹µåÇÞ AI ÀÎÆÛ·±½º ¼¹ö: vLLM ±â¹ÝÀÇ ‘·¹µåÇÞ AI ÀÎÆÛ·±½º ¼¹ö(Red Hat AI Inference Server)’´Â AWS ÀÎÆÛ·±½Ã¾Æ2 ¹× AWS Æ®·¹ÀÌ´Ï¿ò3¸¦ Æ÷ÇÔÇÑ AWS AI Ĩ°ú ÇÔ²² ½ÇÇàµÉ ¼ö ÀÖ°Ô µÇ¸ç, ¸ðµç ¼¼´ëÀÇ »ý¼ºÇü AI ¸ðµ¨À» Áö¿øÇÒ ¼ö ÀÖ´Â °øÅë Ãß·Ð ·¹À̾ Á¦°øÇÑ´Ù. À̸¦ ÅëÇØ °í°´Àº ÇÁ·Î´ö¼Ç ȯ°æÀÇ AI ¹èÆ÷¸¦ È®ÀåÇÔ¿¡ ÀÖ¾î ´õ ³ôÀº ¼º´É, ´õ ³·Àº Áö¿¬ ½Ã°£, ºñ¿ë È¿À²¼ºÀ» ´Þ¼ºÇÒ ¼ö ÀÖ´Ù. ƯÈ÷ ±âÁ¸ GPU ±â¹Ý ¾Æ¸¶Á¸ EC2(Amazon EC2) ÀνºÅϽº ´ëºñ ÃÖ´ë 30~40% Çâ»óµÈ °¡°Ý ´ëºñ ¼º´ÉÀ» Á¦°øÇÑ´Ù.
·¹µåÇÞ ¿ÀǽÃÇÁÆ® »ó¿¡¼ÀÇ AI Áö¿ø: ¾ç»ç´Â AWS »ó¿¡¼ Á¦°øµÇ´Â Æ÷°ýÀûÀÎ ¿ÏÀü °ü¸®Çü ¾ÖÇø®ÄÉÀÌ¼Ç Ç÷§ÆûÀÎ ‘AWS ·¹µåÇÞ ¿ÀǽÃÇÁÆ® ¼ºñ½º(Red Hat OpenShift Service on AWS)’¿Í ‘·¹µåÇÞ ¿ÀǽÃÇÁÆ®(Red Hat OpenShift)’, ‘·¹µåÇÞ ¿ÀÇÁ½ÃÇÁÆ® AI(Red Hat OpenShift AI)’¸¦ À§ÇÑ ‘AWS ´º·±(AWS Neuron)’ ¿ÀÆÛ·¹ÀÌÅ͸¦ °³¹ß ÁßÀÌ´Ù. À̸¦ ÅëÇØ °í°´Àº AWS °¡¼Ó±â¸¦ Ȱ¿ëÇØ AI ¿öÅ©·Îµå¸¦ ´õ¿í ¿øÈ°Çϰí Áö¿øµÇ´Â ¹æ½ÄÀ¸·Î ½ÇÇàÇÒ ¼ö ÀÖ´Â °æ·Î¸¦ Á¦°ø¹Þ°Ô µÈ´Ù.
Á¢±Ù¼º°ú ¹èÆ÷ ¿ëÀ̼º: AWS AI Ĩ Áö¿øÀ» ÅëÇØ ·¹µåÇÞÀº AWS ȯ°æÀÇ ·¹µåÇÞ °í°´¿¡°Ô ¼ö¿ä°¡ ³ô°í ¿ë·®ÀÌ Å« °¡¼Ó±â¿¡ ´ëÇÑ Çâ»óµÇ°í ½¬¿î Á¢±Ù¼ºÀ» Á¦°øÇÒ ¿¹Á¤ÀÌ´Ù. ¶ÇÇÑ ·¹µåÇÞÀº ÃÖ±Ù ‘·¹µåÇÞ ¾Ø¼ºí ¿ÀÅä¸ÞÀÌ¼Ç Ç÷§Æû(Red Hat Ansible Automation Platform)’À» À§ÇÑ ‘¾Æ¸¶Á¸.ai ÀÎÁõ ¾Ø¼ºí Ä÷º¼Ç(amazon.ai Certified Ansible Collection)’À» Ãâ½ÃÇßÀ¸¸ç, À̸¦ ÅëÇØ AWS »ó¿¡¼ AI ¼ºñ½º¸¦ ¿ÀÄɽºÆ®·¹À̼ÇÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù.
¾÷½ºÆ®¸² Ä¿¹Â´ÏƼ ±â¿©: ·¹µåÇÞ°ú AWS´Â vLLM¿¡ ¾÷½ºÆ®¸²(up-stream)µÈ AWS AI Ĩ Ç÷¯±×ÀÎÀ» ÃÖÀûÈÇϱâ À§ÇØ Çù·ÂÇϰí ÀÖ´Ù. vLLMÀÇ ÃÖ´ë »ó¾÷Àû ±â¿©Àڷμ, ·¹µåÇÞÀº AWS »ó¿¡¼ vLLMÀ» Ȱ¼ºÈÇÔÀ¸·Î½á »ç¿ëÀÚÀÇ AI Ãß·Ð ¹× ÇнÀ ¿ª·®À» °¡¼ÓÈÇÏ´Â µ¥ ±â¿©Çϰí ÀÖ´Ù. vLLMÀº ´ë±Ô¸ð Ãß·Ð Á¦°øÀ» ¸ñÇ¥·Î ÇÏ´Â ¿ÀǼҽº ÇÁ·ÎÁ§Æ®ÀÎ llm-dÀÇ ±â¹ÝÀÌ µÇ¸ç, ÇöÀç ·¹µåÇÞ ¿ÀÇÂ½ÃÆ®ÇÁ AI 3¿¡¼ »ó¾÷ÀûÀ¸·Î Áö¿øµÇ´Â ±â´ÉÀ¸·Î Á¦°øµÈ´Ù.
·¹µåÇÞÀº µ¥ÀÌÅͼ¾ÅÍ¿¡¼ ¿§Áö(edge) ȯ°æ¿¡ À̸£±â±îÁö °í°´À» Áö¿øÇϱâ À§ÇØ AWS¿Í ¿À·£ ±â°£ Çù·ÂÇØ ¿Ô´Ù. À̹ø Ãֽмº°ú´Â Á¶Á÷ÀÌ ÇÏÀ̺긮µå Ŭ¶ó¿ìµå Àü·«¿¡ AI¸¦ ÅëÇÕÇÏ´Â °úÁ¤¿¡¼ ÁøÈÇÏ´Â ¿ä±¸»çÇ×À» ÇØ°áÇϰí, ÃÖÀûȵǰí È¿À²ÀûÀÎ »ý¼ºÇü AI ¼º°ú¸¦ ´Þ¼ºÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÑ´Ù.
°¡¿ë¼º
AWS ´º·± Ä¿¹Â´ÏƼ ¿ÀÆÛ·¹ÀÌÅÍ´Â ÇöÀç ·¹µåÇÞ ¿ÀǽÃÇÁÆ® ¶Ç´Â AWS ·¹µåÇÞ ¿ÀǽÃÇÁÆ® ¼ºñ½º¸¦ »ç¿ëÇÏ´Â °í°´À» À§ÇØ ·¹µåÇÞ ¿ÀǽÃÇÁÆ® ¿ÀÆÛ·¹ÀÌÅÍÇãºê(Red Hat OpenShift OperatorHub)¿¡¼ ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. AWS AI ĨÀ» Áö¿øÇÏ´Â ·¹µåÇÞ AI ÀÎÆÛ·±½º ¼¹ö´Â 2026³â 1¿ù °³¹ßÀÚ ÇÁ¸®ºä·Î Á¦°øµÉ ¿¹Á¤ÀÌ´Ù.
|