¿£ºñµð¾Æ°¡ ¾Æ¸¶Á¸À¥¼ºñ½º(Amazon Web Services, AWS)¿Í Çù·ÂÇØ Â÷¼¼´ë ¸Ó½Å ·¯´×(machine learning, ML) ¿öÅ©·Îµå¿ë ¾Æ¸¶Á¸ EC2 ijÆÛ½ÃƼ ºí·Ï(Amazon Elastic Compute Cloud Capacity Blocks)¿¡ ¿£ºñµð¾Æ(NVIDIA) H100 ÅÙ¼ ÄÚ¾î GPU(H100 Tensor Core GPUs)¸¦ žÀçÇÑ´Ù°í ¼Ò°³Çß´Ù.
À̹ø Çù·ÂÀ» ÅëÇØ °í°´µéÀº ¾Æ¸¶Á¸ ÀÏ·¡½ºÆ½ ÄÄǻƮ Ŭ¶ó¿ìµå(EC2)·Î °í¼º´É ¸Ó½Å·¯´× ¿öÅ©·Îµå¿ë ¾Æ¸¶Á¸ EC2 ¿ïÆ®¶óŬ·¯½ºÅÍ(UltraCluster)¿¡ ±¸ÃàµÈ ¼ö¹é °³ÀÇ ¿£ºñµð¾Æ GPU¸¦ È®º¸ÇÒ ¼ö ÀÖ´Ù.
¸Ó½Å·¯´×ÀÇ ¹ßÀüÀ¸·Î ¸ðµç ±Ô¸ðÀÇ »ê¾÷ ºÐ¾ß Á¶Á÷Àº »õ·Î¿î Á¦Ç°À» °³¹ßÇÏ°í ºñÁî´Ï½º¸¦ Çõ½ÅÇÒ ¼ö ÀÖ´Â ±âȸ°¡ »ý°å´Ù. ±âÁ¸ ¸Ó½Å·¯´× ¿öÅ©·Îµå¿¡´Â »ó´çÇÑ ÄÄÇ»Æà ¿ë·®ÀÌ ÇÊ¿äÇÏ´Ù. ¿©±â¿¡ »ý¼ºÇü AIÀÇ µîÀåÀ¸·Î ÆÄ¿îµ¥ÀÌ¼Ç ¸ðµ¨(foundation models, FM)°ú ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM)À» ÈÆ·ÃÇÏ´Â µ¥ »ç¿ëµÇ´Â ¹æ´ëÇÑ µ¥ÀÌÅͼ¼Æ®¸¦ ó¸®Çϱâ À§Çؼ´Â º¸´Ù ´õ Å« ÄÄÇ»Æà ¿ë·®ÀÌ ¿ä±¸µÈ´Ù. GPU Ŭ·¯½ºÅÍ´Â º´·Ä ó¸® ±â´ÉÀÌ °áÇյŠÈƷðú Ãß·Ð ÇÁ·Î¼¼½º¸¦ °¡¼ÓÈÇÔÀ¸·Î½á ÀÌ °úÁ¦¿¡ ¸Å¿ì ÀûÇÕÇÏ´Ù.
±â¾÷µéÀÌ »ý¼ºÇü AIÀÇ Çõ½ÅÀûÀÎ ¿ª·®À» ¾Ë°Ô µÇ¸é¼, GPU¿¡ ´ëÇÑ ¼ö¿ä°¡ °ø±ÞÀ» ´É°¡ÇÏ°í ÀÖ´Ù. µû¶ó¼, ÃֽŠ¸Ó½Å·¯´× ±â¼úÀ» È°¿ëÇÏ°íÀÚ ÇÏ´Â °í°´, ƯÈ÷ µµÀÔ ´Ü°è¿¡ µû¶ó ÇÊ¿äÇÑ ¿ë·®ÀÌ º¯µ¿ÇÏ´Â °í°´Àº ¸Ó½Å·¯´× ¿öÅ©·Îµå¸¦ ½ÇÇàÇÏ´Â µ¥ ÇÊ¿äÇÑ GPU Ŭ·¯½ºÅÍ¿¡ ¾×¼¼½ºÇÏ´Â µ¥ ¾î·Á¿òÀ» °ÞÀ» ¼ö ÀÖ´Ù. °í°´µéÀº Àå±â °è¾àÀ» ¸ÎÁö ¾Ê°íµµ º¸´Ù À¯¿¬ÇÏ°í ¿¹Ãø °¡´ÉÇϵµ·Ï ÇÊ¿äÇÑ GPU ¿ë·®À» È®º¸ÇÒ ¹æ¹ýÀ» ¸ð»öÇÏ°í ÀÖ´Ù.
¸Ó½Å·¯´×¿ë ¾Æ¸¶Á¸ EC2 ijÆÛ½ÃƼ ºí·ÏÀº ¾÷°è ÃÖÃÊ »õ·Î¿î ¼ÒºñÇü ¾Æ¸¶Á¸ EC2 »ç¿ë ¸ðµ¨·Î, GPU ÀνºÅϽº¿¡ ½±°Ô ¾×¼¼½ºÇØ ¸Ó½Å·¯´×°ú »ý¼ºÇü AI ¸ðµ¨À» ÈÆ·ÃÇÏ°í ¹èÆ÷ÇÒ ¼ö ÀÖµµ·Ï ÇÔÀ¸·Î½á ¸Ó½Å·¯´×À» ´õ¿í ´ëÁßÈÇÑ´Ù. EC2 ijÆÛ½ÃƼ ºí·ÏÀ» ÅëÇØ °í°´Àº °í¼º´É ¸Ó½Å·¯´× ¿öÅ©·Îµå·Î ¼³°èµÈ EC2 ¿ïÆ®¶óŬ·¯½ºÅÍ¿¡ ¹èÄ¡µÈ ¼ö¹é °³ÀÇ ¿£ºñµð¾Æ GPU¸¦ ¿¹¾àÇÒ ¼ö ÀÖ´Ù. Æ䟺ñÆ®(peta-bit) ±Ô¸ðÀÇ ³íºí·ÎÅ·(non-blocking) ³×Æ®¿öÅ©¿¡¼ EFA(Elastic, Fabric Adapter) ³×Æ®¿öÅ·À» »ç¿ëÇØ ¾Æ¸¶Á¸ EC2¿¡¼ »ç¿ë °¡´ÉÇÑ ÃÖ°íÀÇ ³×Æ®¿öÅ© ¼º´ÉÀ» Á¦°øÇÒ ¼ö ÀÖ´Ù.
EC2 ijÆÛ½ÃƼ ºí·ÏÀº ÃÖ´ë 8ÁÖ Àü¿¡ ¹Ì¸® È®º¸ÇÒ ¼ö ÀÖÀ¸¸ç, ¿¹¾à °¡´ÉÇÑ ÃÑ Àϼö´Â 1ÀÏ ´ÜÀ§·Î 1~14ÀÏÀÌ´Ù. EC2 ijÆÛ½ÃƼ ºí·ÏÀº 1~64°³ ÀνºÅϽº(512°³ GPU)ÀÇ Å¬·¯½ºÅÍ Å©±â·Î ¿£ºñµð¾Æ H100 ÅÙ¼ ÄÚ¾î GPU ±â¹ÝÀÇ ¾Æ¸¶Á¸ EC2 P5 ÀνºÅϽº(EC2 P5 Instances)¿¡¼ »ç¿ëÇÒ ¼ö ÀÖ´Ù. À̸¦ ÅëÇØ °í°´Àº ±¤¹üÀ§ÇÑ ¸Ó½Å·¯´× ¿öÅ©·Îµå¸¦ À¯¿¬ÇÏ°Ô ½ÇÇàÇÏ°í ÇÊ¿äÇÑ GPU ½Ã°£¸¸Å¸¸ ºñ¿ëÀ» ÁöºÒÇÒ ¼ö ÀÖ´Ù. EC2 ijÆÛ½ÃƼ ºí·ÏÀº °í°´ÀÌ Áß¿äÇÑ ¸Ó½Å·¯´× ÇÁ·ÎÁ§Æ®¿¡ ÇÊ¿äÇÑ GPU ÄÄÇ»Æà ¿ë·®¿¡ ¾ÈÁ¤ÀûÀÌ°í ¿¹Ãø °¡´ÉÇϸç Áß´Ü ¾øÀÌ ¾×¼¼½ºÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù.
EC2 ijÆÛ½ÃƼ ºí·ÏÀ» ÅëÇØ EC2¿¡¼ ¸Ó½Å·¯´×À» ÈÆ·ÃÇÏ´Â µ¥ ÃÖ°í ¼º´ÉÀ» Á¦°øÇÏ´Â EC2 P5 ÀνºÅϽº¸¦ ¿¹Ãø °¡´ÉÇϵµ·Ï ½±°Ô ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ À̸¦ ÅëÇØ ´Ü ¸î ¹øÀÇ Å¬¸¯¸¸À¸·Î GPU ÀνºÅϽº¸¦ È®º¸ÇÏ°í ÀڽŠÀÖ°Ô ¸Ó½Å·¯´× °³¹ßÀ» °èȹÇÒ ¼ö ÀÖ´Ù. EC2 ijÆÛ½ÃƼ ºí·ÏÀÌ ¿¹¾àµÇ¸é, °í°´Àº ÇÊ¿äÇÒ ¶§ GPU ¿ë·®À» È®º¸ÇÒ ¼ö ÀÖ´Ù´Â °ÍÀ» ¾Ë°í È®½ÇÇÏ°Ô ¸Ó½Å·¯´× ¿öÅ©·Îµå ¹èÆ÷¸¦ °èȹÇÒ ¼ö ÀÖ´Ù.
´õºÒ¾î EC2 ijÆÛ½ÃƼ ºí·ÏÀº ¸Ó½Å·¯´× ¸ðµ¨À» ÈÆ·ÃÇÏ°í ¹Ì¼¼ Á¶Á¤°ú ªÀº ½ÇÇè, ÇâÈÄ ¸Ó½Å·¯´× ¾ÖÇø®ÄÉÀ̼ǿ¡ ´ëÇÑ ¼ö¿ä ±ÞÁõ¿¡ ´ëºñÇϱâ À§ÇØ ¿ë·® º¸ÀåÀÌ ÇÊ¿äÇÒ ¶§ »ç¿ëµÉ ¼ö ÀÖ´Ù. ¶Ç´Â ºñÁî´Ï½º ÇÙ½É ¾ÖÇø®ÄÉÀ̼Ç, ±ÔÁ¦ ¿ä±¸ »çÇ× ¶Ç´Â ÀçÇØ º¹±¸ µî ÄÄÇ»Æà ¿ë·® º¸ÀåÀÌ ÇÊ¿äÇÑ ´Ù¸¥ ¸ðµç ¿öÅ©·Îµå À¯Çü¿¡ ´ëÇØ ¿Âµð¸Çµå ¿ë·® ¿¹¾à(On-Demand Capacity Reservations)À» °è¼Ó »ç¿ëÇÒ ¼ö ÀÖ´Ù.
°í°´Àº AWS °ü¸® ÄܼÖ(Management Console), AWS Ä¿¸Çµå ¶óÀÎ ÀÎÅÍÆäÀ̽º(Command Line interface) ¶Ç´Â AWS SDK¸¦ ÅëÇØ »ç¿ë °¡´ÉÇÑ Ä³ÆÛ½ÃƼ ºí·ÏÀ» ã¾Æ ¿¹¾àÇÒ ¼ö ÀÖ´Ù. EC2 ijÆÛ½ÃƼ ºí·ÏÀ¸·Î °í°´Àº ¿¹¾àÇÑ ½Ã°£¸¸Å¸¸ ºñ¿ëÀ» ÁöºÒÇÏ¸é µÈ´Ù. EC2 ijÆÛ½ÃƼ ºí·ÏÀº AWS ¹Ì±¹ µ¿ºÎ ¿ÀÇÏÀÌ¿À Áö¿ª¿¡¼ »ç¿ëÇÒ ¼ö ÀÖÀ¸¸ç, Ãß°¡ AWS Áö¿ª°ú ·ÎÄà ¿µ¿ª¿¡¼ »ç¿ë ¿¹Á¤ÀÌ´Ù.
ÀÚ¼¼ÇÑ ³»¿ëÀº EC2 ijÆÛ½ÃƼ ºí·Ï ¼³¸í¼¸¦ È®ÀÎÇÏ°í EC2¿ë AWS ¸®Æ÷½ºÆ®(Re:Post) ¶Ç´Â ÀϹÝÀûÀÎ AWS Áö¿ø ¿¬¶ôó·Î Çǵå¹éÀ» º¸³»¸é µÈ´Ù. |