¿£ºñµð¾Æ¿¡¼ GTC µðÁöÅÐÀ» ¿©´Â Á¨½¼ Ȳ CEOÀÇ ±âÁ¶ ¿¬¼³°ú ÇÔ²², Â÷¼¼´ë GPU ¾ÆÅ°ÅØóÀÎ ¾ÓÆ丣(Ampere)¸¦ °ø½Ä ¹ßÇ¥Çß´Ù.
À̹ø¿¡ ¹ßÇ¥µÈ ¾ÓÆ丣 ¾ÆÅ°ÅØó´Â ÄÄÇ»Æà ¼º´É¿¡ ÁýÁßÇÑ ±âÁ¸ º¼Å¸ ¾ÆÅ°ÅØóÀÇ ¿¬Àå¼± ¹öÀüÀ¸·Î, °ÔÀÓ È¯°æ¿¡¼ ½Ç½Ã°£ ·¹ÀÌ Æ®·¹ÀÌ½Ì ±¸ÇöÀ» °Á¶ÇØ¿Â ¿£ºñµð¾ÆÀÇ °ÔÀÌ¹Ö¿ë ¾ÓÆ丣 ¾ÆÅ°ÅØó´Â °ø°³µÇÁö ¾Ê¾Ò´Ù.
¾ÓÆ丣 ¾ÆÅ°ÅØó¿¡ Àû¿ëµÈ ÅÙ¼ ÄÚ¾î´Â º¼Å¸ - Æ©¸µÀ» ÀÕ´Â 3¼¼´ë ÅÙ¼ ÄÚ¾î·Î, ±âÁ¸ FP32 º¸´Ù ÃÖ´ë 20¹è ºü¸¥ AI ¿¬»ê ¼º´ÉÀ» ¹ßÈÖÇϸç FP16 ¼öÁØÀÇ Á¤¹Ðµµ¸¦ ±¸ÇöÇÑ TF32(Tensor Float32)¸¦ Áö¿øÇÑ´Ù. TF32´Â ±âÁ¸ ¾îÇø®ÄÉÀ̼ÇÀÇ ÄÚµå º¯È¯ ¾øÀÌ ±×´ë·Î »ç¿ëÇÒ ¼ö ÀÖ´Â °ÍÀÌ Æ¯Â¡À̸ç,
ÀÌ·¯ÇÑ Æ©´×À» ÅëÇØ FP32 Á¤¹Ðµµ AI ¼º´ÉÀ» ÃÖ´ë 20¹è±îÁö ²ø¾î ¿Ã·È´Ù. ¾ÓÆ丣ÀÇ ÅÙ¼ ÄÚ¾î´Â Àü¼¼´ë HPC ¾îÇ÷¹ÄÉÀ̼ǿ¡¼ ÃÖ´ë 2.5¹è ¿¬»ê ¼º´ÉÀ» ¹ßÈÖÇÒ ¼ö ÀÖµµ·Ï FP64 ¿¬»êµµ Áö¿øÇÑ´Ù.
¾ÓÆ丣ÀÇ ¶Ç ´Ù¸¥ Ư¡Àº MIG(Multi-instance GPU)¸¦ ÅëÇØ ÀÛ¾÷ ºÎÇÏ¿¡ µû¶ó ´ÜÀÏ A100 GPU¸¦ 7°³ÀÇ º°µµ GPU·Î ±¸È¹À» ³ª´² ÀÛ¾÷ Á¤µµ¿¡ µû¶ó ÃÖÀûÀÇ È¿À²À» Á¦°øÇÒ ¼ö ÀÖµµ·Ï ¼³°èµÇ¾ú°í, ¸ÖƼ GPU¸¦ À§ÇÑ NVLinkµµ ¾÷±×·¹À̵åµÇ¾î ±âÁ¸ 300GB/s¿¡¼ 600GB/s·Î µÎ ¹èÀÇ ¼Óµµ¸¦ Áö¿øÇÑ´Ù.
¿©±â¿¡ AI ¼öÇÐ(math) Ư¼ºÀ» È°¿ëÇÏ´Â »õ·Î¿î È¿À²¼º ±â¼úÀÎ Structural sparsity¸¦ ÅëÇØ ÅÙ¼ ÄÚ¾îÀÇ TF32/ FP16/ BFLOAT16/ INT8/ INT4 ¼º´ÉÀ» µÎ ¹è·Î Çâ»ó ½ÃÄÑÁØ´Ù. ÀÌó·³ ¾ÓÆ丣ÀÇ ÅÙ¼ ÄÚ¾î È¿À²ÀÌ ³ô¾ÆÁö¸é¼ º¼Å¸ ¹× Æ©¸µ°ú ºñ±³ÇØ SM´ç ÅÙ¼ ÄÚ¾î´Â 8°³¿¡¼ 4°³·Î ÁÙ¾îµé¾ú´Ù.
ÇÑÆí, ÀÌó·³ °ÈµÈ ÅÙ¼ ÄÚ¾î´ö¿¡ ¾ÓÆ丣 ¾ÆÅ°ÅØóÀÇ A100 ÄÚ¾î´Â º¼Å¸ÀÇ V100 ÄÚ¾î ´ëºñ FP16 ¿¬»ê ¼º´ÉÀº ÃÖ´ë 3¹è, FP32 ¼º´ÉÀº 6¹è °ÈµÇ¾ú°í, ½ÇÁ¦ HPC ÀÛ¾÷¿¡¼µµ ÃÖ´ë 2.1¹è ¼º´ÉÀ» Á¦°øÇÏ´Â °ÍÀ¸·Î ¼Ò°³µÇ¾ú´Ù. ´ÜÁö, À̹ø¿¡ ¹ßÇ¥µÈ ¾ÓÆ丣 ¾ÆÄÉƽó´Â HPC ½ÃÀå ´ëÀÀ ¸ðµ¨ÀÎ ¿µÇâÀÎ µí °ÔÀÌ¹Ö ¼º´ÉÀ» ÃßÁ¤ÇÒ ¼ö ÀÖ´Â ±âŸ ¾ÆÅ°ÅØó °ü·Ã ³»¿ëÀº ¸Å¿ì Á¦ÇÑÀûÀÌ¾î¼ ¾Æ½¬¿òÀ» ³²°å´Ù.
Çϵå¿þ¾î¸é¿¡¼ ¾ÓÆ丣 ¾ÆÅ°ÅØóÀÇ A100 ÄÚ¾î´Â TSMC 7nm °øÁ¤À¸·Î »ý»êµÇ¸ç, º¼Å¸ V100 ÄÚ¾îÀÇ 6.7¹è¿¡ ´ÞÇÏ´Â L2 ij½Ã¿Í 2.3¹èÀÇ ´ë¿ªÆøÀ» Á¦°øÇϸç, ¿©±â¿¡ PCIe 4.0°ú 40GBÀÇ HBM2¸¦ Áö¿øÇØ VRAM ´ë¿ªÆøÀº V100ÀÇ 900GB/s¼ 1.6TB/s·Î ¾à 70% È®´ëµÇ¾ú´Ù.
¼º´É Çâ»óÀ» ²ÒÇÏ¸é¼ TSMC 7nm °øÁ¤ µµÀÔ¿¡µµ A100 ÄÚ¾îÀÇ TDP´Â 400W¿¡ ´ÞÇϸç, ÀÌ´Â V100ÀÇ 300W¿¡ ºñÇØ 100W(¾à 33%) ³ô¾ÆÁø ¼öÄ¡´Ù. SMÀº V100ÀÇ 80¿¡¼ A100Àº 108·Î 35% ¸¹¾ÆÁ³´Ù.
|