AI ÄÄÇ»Æà ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ(www.nvidia.co.kr, CEO Á¨½¼ Ȳ)°¡ ¾Æ¸¶Á¸À¥¼ºñ½º(Amazon Web Services, AWS)¿Í ÇÔ²² ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM)°ú »ý¼ºÇü AI ¾ÖÇø®ÄÉÀÌ¼Ç °³¹ßÀ» À§ÇÑ Çù·ÂÀ» ÁøÇàÇÑ´Ù°í ¹àÇû´Ù.
À̹ø Çù·Â¿¡´Â ÃÖ´ë 20 ¿¢»çÇ÷Ó(exaFLOPS)ÀÇ ÄÄÇ»Æà ¼º´ÉÀ» Á¦°øÇÏ´Â ¿£ºñµð¾Æ H100 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU¿Í AWSÀÇ ÃÖ÷´Ü ³×Å©¿öÅ· ¹× È®À强À» ±â¹ÝÀ¸·Î ÇÏ´Â Â÷¼¼´ë Amazon Elastic Compute Cloud(EC2) P5 ÀνºÅϽº°¡ »ç¿ëµÇ¸ç, À̸¦ ÅëÇØ ¼¼°è ÃÖ´ë ±Ô¸ðÀÇ µö·¯´× ¸ðµ¨À» ±¸ÃàÇÏ°í ÈÆ·ÃÇÒ Àü¸ÁÀÌ´Ù.
P5 ÀνºÅϽº´Â 3,200GbpsÀÇ ÀúÁö¿¬, °í´ë¿ªÆø ³×Æ®¿öÅ· 󸮷®À» Á¦°øÇÏ´Â AWSÀÇ 2¼¼´ë Elastic Fabric Adapter(EFA) ³×Æ®¿öÅ·À» È°¿ëÇÏ´Â ÃÖÃÊÀÇ GPU ±â¹Ý ÀνºÅϽº·Î, °í°´µéÀº EC2 ¿ïÆ®¶óŬ·¯½ºÅÍ(UltraCluster)¿¡¼ ÃÖ´ë 20,000°³ÀÇ H100 GPU¸¦ È®ÀåÇØ AI¿ë ½´ÆÛÄÄÇ»ÅÍ±Þ ¼º´É¿¡ ¿Âµð¸Çµå ¹æ½ÄÀ¸·Î ¾×¼¼½ºÇÒ ¼ö ÀÖ´Ù.
AWSÀÇ ¾Æ´ã ¼¿¸³½ºÅ°(Adam Selipsky) CEO´Â "AWS¿Í ¿£ºñµð¾Æ´Â 12³âÀÌ ³Ñ´Â ±ä ½Ã°£ µ¿¾È Çù·ÂÀ» ÅëÇØ AI/¸Ó½Å·¯´×, ±×·¡ÇÈ, °ÔÀ̹Ö, HPC µî ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀ̼ÇÀ» À§ÇÑ ´ë±Ô¸ð ºñ¿ë È¿À²Àû GPU ±â¹Ý ¼Ö·ç¼ÇÀ» ¿Âµð¸Çµå ¹æ½ÄÀ¸·Î Á¦°øÇØ ¿Ô´Ù. AWS´Â ¼¼´ë¸¦ °ÅµìÇÒ ¶§¸¶´Ù È®À强ÀÇ ÇѰ踦 ¶Ù¾î³Ñ´Â GPU ±â¹Ý ÀνºÅϽº¸¦ Á¦°øÇØ ¿Â µ¶º¸ÀûÀÎ °æÇèÀ» º¸À¯ÇÏ°í ÀÖÀ¸¸ç, ÇöÀç ¸¹Àº °í°´µéÀÌ ¸Ó½Å·¯´× Æ®·¹ÀÌ´× ¿öÅ©·Îµå¸¦ 10,000°³ ÀÌ»óÀÇ GPU·Î È®ÀåÇÏ°í ÀÖ´Ù. 2¼¼´ë EFA¿¡¼´Â P5 ÀνºÅϽº¸¦ 20,000°³ ÀÌ»óÀÇ ¿£ºñµð¾Æ H100 GPU·Î È®ÀåÇÔÀ¸·Î½á ½ºÅ¸Æ®¾÷ºÎÅÍ ´ë±â¾÷¿¡ À̸£´Â ´Ù¾çÇÑ °í°´ÀÌ Áï½Ã ½´ÆÛÄÄÇ»ÅÍ ±â´ÉÀ» È°¿ëÇÒ ¼ö ÀÖ´Ù"°í ¸»Çß´Ù.
ÇÑÆí ¿£ºñµð¾Æ ¼³¸³ÀÚ °â CEO Á¨½¼ Ȳ(Jensen Huang)Àº "¶§¸¶Ä§ °¡¼Ó ÄÄÇ»Æðú AI°¡ µîÀåÇß´Ù. °¡¼Ó ÄÄÇ»ÆÃÀº ºñ¿ë°ú Àü·ÂÀ» Àý°¨Çϸ鼵µ ±â´É ¼Óµµ¸¦ Çâ»ó½ÃÅ´À¸·Î½á ±â¾÷µéÀÌ ÀûÀº ÀÚ¿øÀ¸·Îµµ º¸´Ù ¸¹Àº ÀÏÀ» ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. »ý¼ºÇü AI´Â ±â¾÷µéÀÌ Á¦Ç°°ú ºñÁî´Ï½º ¸ðµ¨À» À籸»óÇÏ°í, Çõ½Å¿¡ ÈÛ¾µ¸®´Â °ÍÀÌ ¾Æ´Ï¶ó ½º½º·Î Çõ½ÅÀ» ÀÏÀ¸ÄÑ¾ß ÇÔÀ» Àϱú¿öÁá´Ù. AWS´Â ¿À·£ ÆÄÆ®³ÊÀÌÀÚ ¿£ºñµð¾Æ GPU¸¦ Á¦°øÇÑ ÃÖÃÊÀÇ Å¬¶ó¿ìµå ¼ºñ½º Á¦°ø¾÷ü´Ù. ¾ç»çÀÇ Àü¹®¼º, ±Ô¸ð, ³×Æ®¿öÅ©¸¦ °áÇÕÇØ °í°´µéÀ» Áö¿øÇÒ ¼ö ÀÖ°Ô µÅ ±â»Ú´Ù. °í°´µéÀº °¡¼Ó ÄÄÇ»Æðú »ý¼ºÇü AI¸¦ È°¿ëÇØ ¾ÕÀ¸·ÎÀÇ ¾öû³ ±âȸ¸¦ È°¿ëÇÒ ¼ö ÀÖÀ» °Í”À̶ó°í ¸»Çß´Ù.
»õ·Î¿î ½´ÆÛÄÄÇ»Æà Ŭ·¯½ºÅÍ
»õ·Î¿î P5 ÀνºÅϽº´Â AI ¹× HPC ÀÎÇÁ¶ó Á¦°øÀ» À§ÇØ AWS¿Í ¿£ºñµð¾ÆÀÇ 10³â ³Ñ°Ô À̾îÁø Çù·ÂÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÆ´Ù. P2, P3, P3dn ¹× P4d(e) ÀνºÅϽº¸¦ Æ÷ÇÔÇÑ °ú°Å 4¹øÀÇ Çù¾÷À» ¹ÙÅÁÀ¸·Î ÇÏ´Â P5 ÀνºÅϽº´Â ¿£ºñµð¾Æ GPU¸¦ ž´ëÇÑ AWSÀÇ 5¼¼´ë Á¦Ç°À¸·Î, CG1 ÀνºÅϽº¸¦ ½ÃÀÛÀ¸·Î ¿£ºñµð¾Æ GPU¸¦ óÀ½ ¹èÆ÷ÇÑ Áö ¾à 13³â ¸¸¿¡ Ãâ½ÃµÆ´Ù.
P5 ÀνºÅϽº´Â ÁúÀÇ ÀÀ´ä, ÄÚµå »ý¼º, ºñµð¿À ¹× À̹ÌÁö »ý¼º, À½¼º ÀÎ½Ä µî °¡Àå ±î´Ù·Ó°í ÄÄÇ»Æà Áý¾àÀûÀÎ »ý¼ºÇü AI ¾ÖÇø®ÄÉÀ̼ÇÀ» ºñ·ÔÇØ °¥¼ö·Ï º¹ÀâÇØÁö´Â ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ ¹× ÄÄÇ»ÅÍ ºñÀü ¸ðµ¨ÀÇ ÈƷðú Ãß·Ð ½ÇÇà¿¡ ¸Å¿ì ÀûÇÕÇÏ´Ù.
´õºÒ¾î ±â¾÷°ú ½ºÅ¸Æ®¾÷ ¸ðµÎ°¡ AI ±â¹Ý Çõ½ÅÀ» ½ÃÀå¿¡ Ãâ½ÃÇÒ ¼ö ÀÖµµ·Ï È®Àå °¡´ÉÇÏ°í ¾ÈÀüÇÑ ¹æ½ÄÀ¸·Î ¼³°èµÆÀ¸¸ç, ´ÜÀÏ EC2 ÀνºÅϽº¿¡¼ 16ÆäŸÇ÷Ó(petaFLOPs)ÀÇ È¥ÇÕ Á¤¹Ðµµ ¼º´É, 640GBÀÇ °í´ë¿ªÆø ¸Þ¸ð¸®, 3,200Gbps ³×Æ®¿öÅ· ¿¬°á(ÀÌÀü ¼¼´ë ´ëºñ 8¹è Áõ°¡)À» Áö¿øÇÏ´Â 8°³ÀÇ ¿£ºñµð¾Æ H100 GPU¸¦ °®Ãè´Ù. P5 ÀνºÅϽºÀÇ Çâ»óµÈ ¼º´ÉÀº ¸Ó½Å ·¯´× ¸ðµ¨ ÈÆ·Ã ½Ã°£À» ÃÖ´ë 6¹è±îÁö °¡¼ÓÈÇØ ÈÆ·Ã ½Ã°£À» ¸çÄ¥¿¡¼ ¸î ½Ã°£À¸·Î ´ÜÃà½ÃÅ´À¸·Î½á º¹ÀâÇÑ ´ë±Ô¸ð ¸ðµ¨ÀÇ ÈƷÿ¡ ÀÌ»óÀûÀÌ´Ù. ¶Ç Ãß°¡µÈ GPU ¸Þ¸ð¸®´Â °í°´ÀÌ º¸´Ù Å©°í º¹ÀâÇÑ ¸ðµ¨À» ÈƷýÃÅ°´Â µ¥ µµ¿òÀÌ µÈ´Ù. P5 ÀνºÅϽº´Â ÀÌÀü ¼¼´ë¿¡ ºñÇØ ¸Ó½Å·¯´× ¸ðµ¨ ÈÆ·Ã ºñ¿ëÀ» ÃÖ´ë 40%±îÁö Àý°¨ÇÒ °ÍÀ¸·Î ¿¹»óµÇ´Âµ¥, ÀÌ´Â À¯¿¬¼ºÀÌ ¶³¾îÁö´Â Ŭ¶ó¿ìµå ¼ºñ½º³ª °í°¡ÀÇ ¿ÂÇÁ·¹¹Ì½º ½Ã½ºÅÛ¿¡ ºñÇØ Å« È¿À²¼ºÀ» Á¦°øÇÒ ¼ö ÀÖ´Ù.
¾Æ¸¶Á¸ EC2 P5 ÀνºÅϽº´Â Ŭ¶ó¿ìµå¿¡¼ ÃÖ°í ¼º´ÉÀÇ ÄÄÇ»ÆÃ, ³×Æ®¿öÅ·, ½ºÅ丮Áö·Î ±¸¼ºµÈ ÃÊ´ëÇü Ŭ·¯½ºÅÍ EC2 ¿ïÆ®¶óŬ·¯½ºÅÍ¿¡ ¹èÆ÷µÈ´Ù. °¢ EC2 ¿ïÆ®¶óŬ·¯½ºÅÍ´Â ¼¼°è¿¡¼ °¡Àå °·ÂÇÑ ½´ÆÛÄÄÇ»ÅÍ Áß Çϳª·Î, °í°´µéÀÌ °¡Àå º¹ÀâÇÑ ¸ÖƼ³ëµå ¸Ó½Å·¯´× ÈÆ·Ã ¹× ºÐ»êÇü HPC ¿öÅ©·Îµå¸¦ ½ÇÇàÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. À̵éÀº AWS EFA·Î ±¸µ¿µÇ´Â Æ䟺ñÆ® ±Ô¸ðÀÇ ³íºí·ÎÅ·(non-blocking) ³×Æ®¿öÅ·À» Ư¡À¸·Î ÇÑ´Ù. AWS EFA´Â ¾Æ¸¶Á¸ EC2 ÀνºÅϽº¿ë ³×Æ®¿öÅ© ÀÎÅÍÆäÀ̽º·Î, AWS¿¡¼ ³ôÀº ¼öÁØÀÇ ³ëµå °£ Åë½ÅÀÌ ÇÊ¿äÇÑ ¾ÖÇø®ÄÉÀ̼ÇÀ» ±¸µ¿ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. EFAÀÇ ¸ÂÃãÇü ¿î¿µ üÁ¦(OS) ¹ÙÀÌÆнº Çϵå¿þ¾î ÀÎÅÍÆäÀ̽º¿Í ¿£ºñµð¾Æ GPU´ÙÀÌ·ºÆ®(GPUDirect) RDMA¿ÍÀÇ ÅëÇÕÀº Áö¿¬ ½Ã°£À» ÁÙÀÌ°í ´ë¿ªÆø È°¿ë·üÀ» ³ô¿© ÀνºÅϽº °£ Åë½Å ¼º´ÉÀ» Çâ»óŲ´Ù. ÀÌ´Â ¼ö¹é °³ÀÇ P5 ³ëµå¿¡¼ µö ·¯´× ¸ðµ¨ÀÇ ÈÆ·ÃÀ» È®ÀåÇÏ´Â µ¥ ÇÙ½ÉÀûÀÌ´Ù.
P5 ÀνºÅϽº ¹× EFA¸¦ »ç¿ëÇÏ¸é ¸Ó½Å·¯´× ¾ÖÇø®ÄÉÀ̼ÇÀº NCCL(NVIDIA Collective Communications Library)À» ÅëÇØ ÃÖ´ë 20,000°³ÀÇ H100 GPU±îÁö È®ÀåÇÒ ¼ö ÀÖ´Ù. ±× °á°ú, °í°´µéÀº ¿ÂÇÁ·¹¹Ì½º HPC Ŭ·¯½ºÅÍÀÇ ¾ÖÇø®ÄÉÀÌ¼Ç ¼º´ÉÀº ¹°·Ð AWSÀÇ ¿Âµð¸Çµå ź·Â¼º°ú À¯¿¬¼º ¶ÇÇÑ ¸ðµÎ ´©¸± ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ ÃÖ÷´Ü ÄÄÇ»Æà ±â´É ¿Ü¿¡µµ ¿ÀºêÁ§Æ® ½ºÅ丮Áö¿ë ¾Æ¸¶Á¸ S3, °í¼º´É ÆÄÀÏ ½Ã½ºÅÛ¿ë ¾Æ¸¶Á¸ FSx, µö ·¯´× ¾ÖÇø®ÄÉÀÌ¼Ç ±¸Ãà, Æ®·¹ÀÌ´× ¹× ¹èÆ÷¿ë ¾Æ¸¶Á¸ ¼¼ÀÌÁö¸ÞÀÌÄ¿(SageMaker) µî ¾÷°è ³» °¡Àå ±¤¹üÀ§ÇÏ°í ½ÉÃþÀûÀÎ ¼ºñ½º Æ÷Æ®Æú¸®¿À ¶ÇÇÑ »ç¿ë °¡´ÉÇÏ´Ù. ÇØ´ç ±â´ÉÀ¸·Î °´Ã¼ ÀúÀå, °í¼º´É ÆÄÀÏ ½Ã½ºÅÛ ¹× µö ·¯´× ¾ÖÇø®ÄÉÀÌ¼Ç ±¸Ãà, ÈÆ·Ã ¹× ¹èÆ÷ µî ÀÛ¾÷À» ÇÒ ¼ö ÀÖ´Ù. P5 ÀνºÅϽº´Â °¡±î¿î ½ÃÀÏ ³» Á¦ÇÑµÈ ¹Ì¸® º¸±â ÇüÅ·ΠÁ¦°øµÉ ¿¹Á¤ÀÌ´Ù. ¿©±â¿¡¼ ¾×¼¼½º¸¦ ¿äûÇÒ ¼ö ÀÖ´Ù.
»õ·Î¿î EC2 P5 ÀνºÅϽº¸¦ »ç¿ëÇÏ¸é ¾ØÆ®·ÎÇÈ(Anthropic), ÄÚÈ÷¾î(Cohere), Çã±ëÆäÀ̽º(Hugging Face), ÇÉÅÍ·¹½ºÆ®(Pinterest), ½ºÅºô¸®Æ¼AI(Stability AI)¿Í °°Àº °í°´µéÀÌ ´ë±Ô¸ð ¸Ó½Å·¯´× ¸ðµ¨À» ±¸ÃàÇÏ°í ÈƷýÃų ¼ö ÀÖ´Ù. ÇÑÆí Ãß°¡ ¼¼´ëÀÇ EC2 ÀνºÅϽº¸¦ ÅëÇÑ Çù¾÷Àº ½ºÅ¸Æ®¾÷, ¿£ÅÍÇÁ¶óÀÌÁî, ¿¬±¸ÀÚµéÀÌ ¸Ó½Å·¯´× ¿ä±¸ »çÇ×À» ÃæÁ·Çϱâ À§ÇØ ¸Å²ô·´°Ô È®ÀåÇÒ ¼ö ÀÖµµ·Ï µµ¿òÀ» ÁÙ ¼ö ÀÖ´Ù.
¾ØÆ®·ÎÇÈÀº ½Å·ÚÇÒ ¼ö ÀÖ°í Çؼ® °¡´ÉÇϸç Á¶Á¤ °¡´ÉÇÑ AI ½Ã½ºÅÛÀ» ±¸ÃàÇÑ´Ù. À̵éÀº °øÀÍÀû, »ó¾÷Àû °¡Ä¡¸¦ âÃâÇÒ ¼ö ÀÖ´Â ¸¹Àº ±âȸ¸¦ °¡Áö°í ÀÖ´Ù. ¾ØÆ®·ÎÇÈÀÇ °øµ¿ ¼³¸³ÀÚ Åè ºê¶ó¿î(Tom Brown)Àº "¾ØÆ®·ÎÇÈÀº ½Å·ÚÇÒ ¼ö ÀÖ°í Çؼ® °¡´ÉÇϸç, Á¶Á¤ °¡´ÉÇÑ AI ½Ã½ºÅÛÀ» ±¸ÃàÇϱâ À§ÇØ ³ë·ÂÇÏ°í ÀÖ´Ù. ¿À´Ã³¯ÀÇ ´ë±Ô¸ð ÀÏ¹Ý AI ½Ã½ºÅÛÀº »ó´çÇÑ ÀÌÁ¡À» Á¦°øÇÒ ¼ö ÀÖÁö¸¸, ¿¹ÃøÀÌ ¾î·Æ°í ½Å·ÚÇÒ ¼ö ¾øÀ¸¸ç ºÒÅõ¸íÇÒ ¼ö ÀÖ´Ù´Â ´ÜÁ¡ÀÌ ÀÖ´Ù. ¿ì¸®ÀÇ ¸ñÇ¥´Â ÀÌ·¯ÇÑ ¹®Á¦µéÀ» ÇØ°áÇÏ°í »ç¶÷µéÀÌ À¯¿ëÇÏ°Ô »ç¿ëÇÒ ¼ö ÀÖ´Â ½Ã½ºÅÛÀ» ¹èÆ÷ÇÏ´Â °ÍÀÌ´Ù. ¾ØÆ®·ÎÇÈÀº µö ·¯´× ¿¬±¸ÀÇ ±âÃÊ ¸ðµ¨À» ±¸ÃàÇÏ´Â ¼¼°è¿¡¼ ¸î ¾È µÇ´Â ´Üü Áß Çϳª´Ù. µö ·¯´× ¿¬±¸ÀÇ ±âÃÊ ¸ðµ¨Àº ¸Å¿ì º¹ÀâÇϸç, ÀÌ·¯ÇÑ ÃÖ÷´Ü ¸ðµ¨À» °³¹ßÇÏ°í ÈÆ·ÃÇÏ·Á¸é ÇØ´ç ¸ðµ¨À» ´ë±Ô¸ð GPU Ŭ·¯½ºÅÍ¿¡ È¿À²ÀûÀ¸·Î ºÐ»ê½ÃÄÑ¾ß ÇÑ´Ù. ¿ì¸®´Â ÇöÀç ¾Æ¸¶Á¸ EC2 P4 ÀνºÅϽº¸¦ ±¤¹üÀ§ÇÏ°Ô »ç¿ëÇÏ°í ÀÖÀ¸¸ç, °ð Ãâ½ÃµÉ P5 ÀνºÅϽº¿¡µµ Å« ±â´ë¸¦ °É°í ÀÖ´Ù. P5 ÀνºÅϽº´Â P4d ÀνºÅϽº¿¡ ºñÇØ »ó´çÇÑ °¡¼ººñ(°¡°Ý ´ëºñ ¼º´É ÀÌÁ¡)À» Á¦°øÇÒ °ÍÀ¸·Î ±â´ëµÇ¸ç, Â÷¼¼´ë ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ ¹× °ü·Ã Á¦Ç°À» ±¸ÃàÇÒ ¶§ ´ë±Ô¸ð·Î »ç¿ëÇÒ ¼ö ÀÖÀ» °Í"À̶ó°í ¸»Çß´Ù.
¾ð¾î AI ºÐ¾ßÀÇ ¼±µÎÁÖÀÚ ÄÚÈ÷¾î´Â ¸ðµç °³¹ßÀÚ¿Í ±â¾÷µéÀÌ µ¥ÀÌÅ͸¦ ¾ÈÀüÇÏ°Ô º¸È£ÇÏ¸é¼ ¼¼°è ÃÖ°í ¼öÁØÀÇ ÀÚ¿¬¾î ó¸®(natural language processing, NLP) ±â¼ú·Î ³î¶ó¿î Á¦Ç°À» °³¹ßÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. ÄÚÈ÷¾îÀÇ ¿¡ÀÌ´Ü °í¸ÞÁî(Aidan Gomez) CEO´Â "ÄÚÈ÷¾î´Â ¸ðµç ±â¾÷ÀÌ ¾ð¾î AIÀÇ ÈûÀ» È°¿ëÇØ ÀÚ¿¬½º·´°í Á÷°üÀûÀÎ ¹æ½ÄÀ¸·Î Á¤º¸¸¦ Ž»ö, »ý¼º, °Ë»ö ¹× Á¶Ä¡ÇÒ ¼ö ÀÖµµ·Ï ¾ÕÀå¼°í ÀÖ´Ù. ´õºÒ¾î Á¤º¸¸¦ °¢ °í°´¿¡°Ô °¡Àå ÀûÇÕÇÑ µ¥ÀÌÅÍ È¯°æ¿¡¼ ¿©·¯ Ŭ¶ó¿ìµå Ç÷§Æû¿¡ ¹èÆ÷ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. ¿£ºñµð¾Æ H100À» žÀçÇÑ ¾Æ¸¶Á¸ EC2 P5 ÀνºÅϽº´Â ÄÚÈ÷¾îÀÇ ÃÖ÷´Ü ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ ¹× »ý¼ºÇü AI ±â´ÉÀ» °áÇÕÇØ ºñÁî´Ï½º°¡ ´õ¿í ºü¸£°Ô ¼ºÀåÇÏ°í È®ÀåÇÒ ¼ö ÀÖ´Â ÄÄÇ»Æà ÆÄ¿ö¸¦ Á¦°øÇÒ °ÍÀÌ´Ù”¶ó°í ¸»Çß´Ù.
Çã±ë ÆäÀ̽º´Â ¿ì¼öÇÑ ¸Ó½Å ·¯´×À» ´ëÁßÈÇÏ°Ú´Ù´Â »ç¸íÀ» °¡Áö°í ÀÖ´Ù. Çã±ëÆäÀ̽º °øµ¿ ⸳ÀÚ °â CTO ÁÙ¸®¾Ó ¼î¸ù(Julien Chaumond)Àº "Çã±ëÆäÀ̽º´Â ¸Ó½Å ·¯´× ºÐ¾ß¿¡¼ °¡Àå ºü¸£°Ô ¼ºÀåÇÏ´Â ¸Ó½Å ·¯´× ¿ÀÇ ¼Ò½º Ä¿¹Â´ÏƼ·Î, ÇöÀç NLP, ÄÄÇ»ÅÍ ºñÀü, »ý¹°ÇÐ, °È ÇнÀ µîÀ» À§ÇÑ Ç÷§Æû¿¡¼ 15¸¸ °³ ÀÌ»óÀÇ »çÀü ÈÆ·Ã ¸ðµ¨°ú 25,000°³ ÀÌ»óÀÇ µ¥ÀÌÅÍ ¼¼Æ®¸¦ Á¦°øÇÏ°í ÀÖ´Ù. Çã±ëÆäÀ̽º´Â ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ ¹× »ý¼ºÇü AI ºÐ¾ßÀÇ Ä¿´Ù¶õ ¹ßÀü¿¡ ¹ß¸ÂÃç AWS¿Í ÇÔ²² ¹Ì·¡ÀÇ ¿ÀÇ ¼Ò½º ¸ðµ¨À» ±¸ÃàÇÏ°í ±â¿©ÇÏ°íÀÚ ³ë·ÂÇÏ°í ÀÖ´Ù. EFA°¡ Æ÷ÇÔµÈ ¿ïÆ®¶óŬ·¯½ºÅÍ¿¡¼ ¾Æ¸¶Á¸ ¼¼ÀÌÁö¸ÞÀÌÄ¿¸¦ ÅëÇØ ´ë±Ô¸ð ¾Æ¸¶Á¸ EC2 P5 ÀνºÅϽº¸¦ »ç¿ëÇÏ¿© ¸ðµÎ¸¦ À§ÇÑ »õ·Î¿î ±â¹Ý AI ¸ðµ¨ÀÇ Á¦°øÀ» °¡¼ÓÈÇÒ ¼ö Àֱ⸦ ±â´ëÇÑ´Ù"°í ¸»Çß´Ù.
¿À´Ã³¯ Àü ¼¼°è 4¾ï 5,000¸¸ ¸í ÀÌ»óÀÇ »ç¶÷µéÀÌ ÇÉÅÍ·¹½ºÆ® Ç÷§ÆûÀ» »ç¿ëÇØ ½Ã°¢Àû ¿µ°¨À» ¾ò°í ÀÖ´Ù. ÀÚ½ÅÀÇ ÃëÇâ¿¡ ¸Â´Â Á¦Ç°À» ¼îÇÎÇÏ°í, ¿ÀÇÁ¶óÀο¡¼ ½ÇÇàÇÒ ¼ö ÀÖ´Â ¾ÆÀ̵ð¾î¸¦ ã°í, ¿µ°¨À» ºÒ¾î³Ö´Â Å©¸®¿¡ÀÌÅ͸¦ ¹ß°ßÇÏ´Â °ÍÀÌ´Ù. ÇÉÅÍ·¹½ºÆ® ¼ö¼® ¾ÆÅ°ÅØÆ® µ¥À̺ñµå ¼ÎÀÌÅ«(David Chaiken)Àº "¿ì¸®´Â P3 ¹× ÃֽŠP4d ÀνºÅϽº¿Í °°Àº AWS GPU ÀνºÅϽº¸¦ È°¿ëÇØ Ç÷§Æû Àü¹Ý¿¡ °ÉÃÄ µö ·¯´×À» ±¤¹üÀ§ÇÏ°Ô »ç¿ëÇÏ°í ÀÖ´Ù. ¾Æ¿ï·¯ ¾÷·Îµå µÈ ¼ö½Ê¾ï ÀåÀÇ »çÁøÀ» ¶óº§¸µÇÏ°í ºÐ·ùÇÏ´Â ÀÛ¾÷¿¡µµ È°¿ëÇÏ°í ÀÖÀ¸¸ç, ºñÁÖ¾ó °Ë»ö ±â´ÉÀ» ÅëÇØ »ç¿ëÀÚ°¡ ¿µ°¨À» ¹ÞÀº ³»¿ëÀ» Á÷Á¢ Çö½Ç¿¡¼ ½ÇÇàÇÒ ¼ö ÀÖµµ·Ï µ½´Â ±â´ÉÀ» Á¦°øÇÏ°í ÀÖ´Ù. ¿£ºñµð¾Æ H100 GPU, EFA ¹× ¿ïÆ®¶óŬ·¯½ºÅÍ°¡ žÀçµÈ ¾Æ¸¶Á¸ EC2 P5 ÀνºÅϽº¸¦ »ç¿ëÇØ Á¦Ç° °³¹ßÀ» °¡¼ÓÈÇÏ°í °í°´¿¡°Ô »õ·Î¿î °ø°¨Çü AI ±â¹Ý °æÇèÀ» Á¦°øÇÒ ¼ö Àֱ⸦ ±â´ëÇÏ°í ÀÖ´Ù"°í ¸»Çß´Ù.
¸ÖƼ¸ð´Þ(multimodal) ¿ÀǼҽº AI ¸ðµ¨ °³¹ß ¹× ¹èÆ÷ÀÇ ¼±µÎÁÖÀÚÀÎ ½ºÅºô¸®Æ¼AI´Â °ø°ø ¹× ¹Î°£ ºÎ¹® ÆÄÆ®³Ê¿Í Çù·ÂÇØ Â÷¼¼´ë ÀÎÇÁ¶ó¸¦ Àü ¼¼°è °í°´µé¿¡°Ô Á¦°øÇÏ°í ÀÖ´Ù. ¿¡¸¶µå ¸ð½ºÅ¸Å©(Emad Mostaque) ½ºÅºô¸®Æ¼AI CEO´Â "¿ì¸®ÀÇ ¸ñÇ¥´Â ÃֽŠAIÀÇ Á¢±Ù¼ºÀ» ±Ø´ëÈÇØ Àü ¼¼°èÀÇ Ã¢ÀǼº°ú Çõ½Å¿¡ ¿µ°¨À» ºÒ¾î³Ö´Â °ÍÀÌ´Ù. ¿ì¸®´Â Áö³ 2021³â AWS¿Í ÆÄÆ®³Ê½ÊÀ» ¸Î°í ¾Æ¸¶Á¸ EC2 P4d ÀνºÅϽº¸¦ È°¿ëÇØ ÀáÀçÀû ÅؽºÆ® Åõ À̹ÌÁö(text-to-image, TTI) È®»ê ¸ðµ¨ÀÎ ½ºÅ×ÀÌºí µðÇ»Àü(Stable Diffusion)À» ÃÖÃÊ·Î ±¸ÃàÇß´Ù. ÀÌ´Â ¸ðµ¨ ÈÆ·Ã ½Ã°£À» ¸î ´Þ¿¡¼ ¸î ÁÖ·Î ´ÜÃàÇÏ´Â È¿°ú¸¦ Á¦°øÇÑ´Ù. Â÷¼¼´ë ¿ÀÇ ¼Ò½º »ý¼ºÇü AI ¸ðµ¨À» °³¹ßÇÏ°í »õ·Î¿î ¹æ½ÄÀ¸·Î È®ÀåÇÏ´Â °úÁ¤¿¡¼ 2¼¼´ë EC2 ¿ïÆ®¶óŬ·¯½ºÅÍ¿¡¼ ¾Æ¸¶Á¸ EC2 P5 ÀνºÅϽº¸¦ »ç¿ëÇÒ °ÍÀÌ´Ù. P5 ÀνºÅϽº´Â ¸ðµ¨ ÈÆ·Ã ½Ã°£À» ÃÖ´ë 4¹è ´ÜÃàÇØ ´õ ºü¸£°í Àú·ÅÇÏ°Ô Ã·´Ü AI¸¦ Á¦°øÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù"¶ó°í ¸»Çß´Ù.
È®Àå °¡´ÉÇÏ°í È¿À²ÀûÀÎ AI¸¦ À§ÇÑ »õ·Î¿î ¼¹ö ¼³°è
H100 Ãâ½Ã¸¦ ¾ÕµÎ°í ¿, Àü±â, ±â°è ºÐ¾ßÀÇ Àü¹®¼ºÀ» °®Ãá ¿£ºñµð¾Æ¿Í AWS ¿£Áö´Ï¾î¸µ ÆÀÀº GPU¸¦ È°¿ëÇØ ´ë±Ô¸ð·Î AI¸¦ Á¦°øÇÏ´Â ¼¹ö¸¦ ¼³°èÇϱâ À§ÇØ Çù·ÂÇß´Ù. ƯÈ÷ ÀÌ °úÁ¤¿¡¼ AWS ÀÎÇÁ¶óÀÇ ¿¡³ÊÁö È¿À²¼º¿¡ ÁßÁ¡À» µ×´Ù. GPU´Â ÀϹÝÀûÀ¸·Î ƯÁ¤ AI ¿öÅ©·Îµå¿¡¼ CPUº¸´Ù ¿¡³ÊÁö È¿À²ÀÌ 20¹è ´õ ³ôÀ¸¸ç, LLMÀÇ °æ¿ì H100°¡ CPU¿¡ ºñÇØ ÃÖ´ë 300¹è ³ôÀº È¿À²¼ºÀ» º¸ÀδÙ.
¿£ºñµð¾Æ¿Í AWS°¡ °øµ¿À¸·Î ÀÛ¾÷ÇÒ ³»¿ë¿¡´Â ½Ã½ºÅÛ ¹æ¿ ¼³°è, ÅëÇÕ º¸¾È ¹× ½Ã½ºÅÛ °ü¸®, AWS ´ÏÆ®·Î(Nitro) Çϵå¿þ¾î °¡¼Ó ÇÏÀÌÆÛ¹ÙÀÌÀú¸¦ ÅëÇÑ º¸¾È, AWS Ä¿½ºÅÒ EFA ³×Æ®¿öÅ© Æк긯À» À§ÇÑ ¿£ºñµð¾Æ GPU´ÙÀÌ·ºÆ®(Direct) ÃÖÀûÈ °³¹ß µîÀÌ Æ÷ÇԵȴÙ.
¾ç»ç´Â ¼¹ö ÃÖÀûÈ¿¡ ÁßÁ¡À» µÎ°í ÁøÇàÇÑ ÀÛ¾÷À» ±â¹ÝÀ¸·Î Â÷¼¼´ë ½Ã½ºÅÛ ¼³°è, ³Ã°¢ ±â¼ú ¹× ³×Æ®¿öÅ© È®À强 Çâ»óÀ» À§ÇÑ ¼¹ö ¼³°è¿¡ ´ëÇÑ Çù¾÷À» °³½ÃÇÑ´Ù.
|