¿£ºñµð¾Æ´Â ¾Æ¸¶Á¸À¥¼ºñ½º(Amazon Web Services, ÀÌÇÏ AWS)ÀÇ ¾Æ¸¶Á¸ EC2 G4 ÀνºÅϽº°¡ ¿£ºñµð¾Æ T4 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU¸¦ ÅëÇØ ÇÏÀÌÆÛ½ºÄÉÀÏ ÀΰøÁö´É(AI) ÀÎÆÛ·±½º(inference), Ŭ¶ó¿ìµå °ÔÀ̹Ö, ÃֽŠRTX ±×·¡ÇÈÀ» °¡¼ÓÈÇÑ´Ù°í ¹àÇû´Ù. ¿£ºñµð¾Æ T4 ÅÙ¼ ÄÚ¾î GPU¸¦ ÀåÂøÇÑ ¾Æ¸¶Á¸ EC2 G4 ÀνºÅϽº´Â ÇöÀç ºÏ¹Ì, À¯·´ ¹× ¾Æ½Ã¾ÆÁö¿ª¿¡¼ ÀÌ¿ë °¡´ÉÇÏ´Ù.
±¤¹üÀ§ÇÑ ¼ÒÇÁÆ®¿þ¾î ½ºÅÃÀ» Áö¿øÇÏ´Â ¿£ºñµð¾Æ T4 GPU´Â ¾Æ¸¶Á¸ EC2 G4 ÀνºÅϽº »ç¿ëÀÚ¿¡ ³ôÀº ¼º´É, È¿À²¼º ±×¸®°í ´Ù¾çÇÑ ±â´ÉÀ» Á¦°øÇÑ´Ù.
ÇØ´ç ¼ÒÇÁÆ®¿þ¾î Ç÷§ÆûÀº µö ·¯´×À» À§ÇÑ ¿£ºñµð¾Æ cuDNN, µ¥ÀÌÅÍ ºÐ¼® ¹× ¸Ó½Å ·¯´×À» À§ÇÑ ¿£ºñµð¾Æ ·¡ÇÇÁî(RAPIDS), Ŭ¶ó¿ìµå ¿öÅ©½ºÅ×ÀÌ¼Ç ±×·¡ÇÈÀ» À§ÇÑ ¿£ºñµð¾Æ Äõµå·Î °¡»ó ¿öÅ©½ºÅ×À̼Ç(Quadro Virtual Workstation), Ŭ¶ó¿ìµå °ÔÀ̹ÖÀ» À§ÇÑ ¿£ºñµð¾Æ ÁöÆ÷½º(GeForce)¸¦ Æ÷ÇÔÇÑ ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀ̼ǿ¡ ÃÖÀûȵǾî ÀÖ´Ù.
¶ÇÇÑ ¼ÒÇÁÆ®¿þ¾î ½ºÅÿ¡´Â ´Ù¾çÇÑ API, Äí´Ù(CUDA), ±×¸®°í ÅÙ¼RT(TensorRT), NCCL, ¿Éƽ½º(OptiX), ºñµð¿À ÄÚµ¦ SDK¿Í °°Àº µµ¸ÞÀκ°·Î Æ¯ÈµÈ Äí´Ù-X ¶óÀ̺귯¸®°¡ Æ÷ÇԵȴÙ. »ç¿ëÀÚ´Â ´ÜÀÏ ÀνºÅϽº¸¦ È°¿ëÇØ ¿©·¯ À¯ÇüÀÇ ¿öÅ©·Îµå¸¦ ¿øÈ°ÇÏ°í ºñ¿ë È¿À²ÀûÀ¸·Î °¡¼ÓÈÇÒ ¼ö ÀÖ´Ù.
AWS ÄÄǻƮ ¼ºñ½º ´ã´ç ºÎ»çÀå ¸ÅÆ® °¡¸Õ(Matt Garman)Àº “¿ì¸®´Â °í°´µéÀÌ ÄÄǻƮ Áý¾àÀûÀÎ ¾ÖÇø®ÄÉÀ̼ÇÀÇ ÀÌÁ¡À» ´©¸± ¼ö ÀÖµµ·Ï Çϴµ¥ ÁýÁßÇÏ°í ÀÖ´Ù. AWS´Â ´Ù¾çÇÑ ¸Ó½Å ·¯´× »ç¿ë »ç·Ê¿¡ ÃÖÀûÈµÈ ¾Æ¸¶Á¸ EC2ÀÇ ´Ù¾çÇÑ ÀνºÅϽº À¯ÇüÀ» ±â¹ÝÀ¸·Î ¸Ó½Å ·¯´× ¸ðµ¨À» °³¹ß, ÈÆ·Ã, ±¸ÃàÇÒ ¼ö ÀÖ´Â °¡Àå Æ÷°ýÀûÀÎ Æ÷Æ®Æú¸®¿À¸¦ Á¦°øÇÑ´Ù. T4 GPU·Î ±¸µ¿µÇ´Â »õ·Î¿î G4 ÀνºÅϽº¸¦ ÅëÇØ ¸ðµç °³¹ßÀÚµéÀÌ ¸Ó½Å ·¯´×À» º¸´Ù ÇÕ¸®ÀûÀÎ ºñ¿ëÀ¸·Î È°¿ëÇÒ ¼ö ÀÖ°Ô µÆ´Ù”°í ¸»Çß´Ù.
¿£ºñµð¾Æ T4´Â 2¼¼´ë ÅÙ¼ ÄÚ¾î GPU·Î, Äí´ÙÀÇ ÇÁ·Î±×·¡¹Ö ¼º´ÉÀ» À¯ÁöÇÏ¸é¼ AI ¾ÖÇø®ÄÉÀ̼ÇÀ» À§ÇÑ ÃÖ°íÀÇ ¼º´ÉÀ» Áö¿øÇÏ´Â GPU·Î ÀçâÁ¶µÈ °ÍÀÌ´Ù. INT8¿¡¼ ÃÖ´ë 130 TOPS(ÃÊ´ç Å×¶ó ¿¬»ê)ÀÇ ¼º´ÉÀ» ±¸ÇöÇÏ´Â ¿£ºñµð¾Æ T4´Â À̹ÌÁö ºÐ·ù, °´Ã¼ °¨Áö, ÀÚ¿¬¾î ÀÌÇØ, ÀÚµ¿ À½¼º ÀÎ½Ä ¹× Ãßõ ½Ã½ºÅÛ°ú °°Àº AI ±â¹Ý ¾ÖÇø®ÄÉÀ̼ÇÀÇ ²÷ÀÓ¾ø´Â Çõ½Å, ´Ù¾ç¼º ¹× º¹À⼺À» °¡¼ÓÈÇϴµ¥ ÇÊ¿äÇÑ È¥ÇÕ Á¤¹Ð ÅÙ¼ ÇÁ·Î¼¼½Ì ±â´ÉÀ» °®Ãè´Ù.
AWS´Â ¾÷°è¿¡¼ °¡Àå ºü¸¥ ÇÏÀÌÆÛ½ºÄÉÀÏ Å¬¶ó¿ìµå Ç÷§Æû Áß Çϳª·Î, ÈÆ·Ã ¹× ÀÎÆÛ·±½º¸¦ À§ÇØ Áï½Ã »ç¿ë°¡´ÉÇÑ ¿£ºñµð¾Æ NGC ÄÁÅ×À̳ʸ¦ Áö¿øÇÏ¿© ¿£ºñµð¾Æ GPU¸¦ ÇÁ·ÎºñÀú´× ÇÑ´Ù. EC2 P3 ÀνºÅϽº¿¡´Â ¿£ºñµð¾Æ V100 ÅÙ¼ ÄÚ¾î GPU°¡ žÀçµÇ¾î ÀÖ¾î °í°´µéÀº AMP(Automatic Mixed Precision) ±â´ÉÀ» »ç¿ëÇØ ¸Ó½Å ·¯´× ÈÆ·Ã ±â°£À» ¸çÄ¥¿¡¼ ´Ü ¸î ½Ã°£À¸·Î ´ÜÃà½Ãų ¼ö ÀÖ´Ù. ¶ÇÇÑ, EC2 G4¸¦ ÅëÇØ °í°´µéÀº AI ¼ºñ½º¸¦ ´ë±Ô¸ð·Î ±¸ÃàÇÏ¸é¼ ¿î¿µºñ¿ëÀº Å©°Ô Àý°¨ÇÒ ¼ö ÀÖ´Ù.
±â¾÷µéÀº ÀÌ·¯ÇÑ ¿£ÅÍÇÁ¶óÀÌÁî±Þ ÇÏÀ̺긮µå Ŭ¶ó¿ìµå Ç÷§ÆûÀ» »ç¿ëÇØ ¾ÖÇø®ÄÉÀ̼ÇÀÇ Çö´ëȸ¦ °¡¼ÓÈÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ, µ¥ÀÌÅÍ ¼¾ÅÍ¿¡¼ AWS Ŭ¶ó¿ìµå¿¡ À̸£´Â VM¿þ¾î ÀÎÇÁ¶ó Àü¹Ý¿¡¼ ±¸Ãà, ¸¶À̱׷¹ÀÌ¼Ç ¹× ¿î¿µÀ» ÅëÇÕÇÏ¿© AI, ¸Ó½Å ·¯´×, µ¥ÀÌÅÍ ºÐ¼®À» Æ÷ÇÔÇÑ °¡Àå ÄÄǻƮ Áý¾àÀûÀÎ ¿öÅ©·Îµå¸¦ Áö¿øÇÒ ¼ö ÀÖ´Ù.
ÀÚ¼¼ÇÑ ³»¿ëÀº NVIDIA °ø½Ä ȨÆäÀÌÁö¸¦ ÅëÇØ È®ÀÎÇÒ ¼ö ÀÖ´Ù.
|