±¸±Û Ŭ¶ó¿ìµå(Google Cloud)°¡ 6ÀÏ(ÇöÁö½Ã°£) AI Ãß·Ð(Inference) ½Ã´ë¸¦ À̲ø ÇÙ½É ÄÄÇ»ÆÃ ¼Ö·ç¼ÇÀÎ 7¼¼´ë TPU ‘¾ÆÀ̾ð¿ìµå(Ironwood)’ÀÇ Á¤½Ä Ãâ½Ã(GA)¿Í »õ·Î¿î Arm® ±â¹Ý ¾Ç½Ã¿Â(Axion) °¡»ó ¸Ó½Å(VM) ÀνºÅϽºÀÇ ÇÁ¸®ºä ¹öÀüÀ» ¹ßÇ¥Çß´Ù. ±¸±Û Ŭ¶ó¿ìµå´Â À̸¦ ÅëÇØ ±â¾÷ °í°´¿¡°Ô AI Ã߷аú ¹ü¿ë ÄÄÇ»ÆÃ ¿öÅ©·Îµå Àü¹Ý¿¡¼ ¾ÐµµÀûÀÎ ¼º´É°ú È¿À²¼º Çõ½ÅÀ» Á¦°øÇÒ ¿¹Á¤ÀÌ´Ù.
¾ÆÀ̾ð¿ìµå(Ironwood): ¸ðµ¨ ÇнÀ¿¡¼ °·ÂÇÑ Ãß·ÐÀ¸·Î °¡´Â Áö¸§±æ
±¸±Û Ŭ¶ó¿ìµå´Â Áö³ 4¿ù ±¸±Û Ŭ¶ó¿ìµå ³Ø½ºÆ® 2025(Next 2025) Çà»ç¿¡¼ ÇÁ¸®ºä ¹öÀüÀ¸·Î °ø°³ÇÑ 7¼¼´ë TPU(Tensor Processing Unit) ¾ÆÀ̾ð¿ìµå°¡ ¸î ÁÖ ³»¿¡ Á¤½Ä Ãâ½ÃµÈ´Ù°í ¹àÇû´Ù. ¾ÆÀ̾ð¿ìµå´Â ´ë±Ô¸ð ¸ðµ¨ ÇнÀ, º¹ÀâÇÑ °ÈÇнÀ(RL), ´ë¿ë·®•ÀúÁö¿¬ AI Ãß·Ð µî °¡Àå ±î´Ù·Î¿î AI ¿öÅ©·Îµå¸¦ ó¸®Çϵµ·Ï Ưº°È÷ ¼³°èµÆ´Ù. TPU v5p ´ëºñ ÃÖ´ë 10¹è Çâ»óµÈ ¼º´É°ú Æ®¸±¸®¿ò(TPU v6e) ´ëºñ Ĩ´ç ÃÖ´ë 4¹è Çâ»óµÈ ÇнÀ ¹× Ãß·Ð ÀÛ¾÷ ¼º´ÉÀ» Á¦°øÇϸç, ÇöÁ¸ÇÏ´Â ±¸±ÛÀÇ TPU Áß °¡Àå °·ÂÇÑ ¼º´É ¹× ¿¡³ÊÁö È¿À²¼ºÀ» ÀÚ¶ûÇÑ´Ù.
¾ÆÀ̾ð¿ìµå´Â ±¸±Û Ŭ¶ó¿ìµåÀÇ ÅëÇÕ AI ½´ÆÛÄÄÇ»ÆÃ ½Ã½ºÅÛ ‘AI ÇÏÀÌÆÛÄÄÇ»ÅÍ(Hypercomputer)’ÀÇ ÇÙ½É ±¸¼º ¿ä¼Ò·Î, ÄÄÇ»ÆÃ•³×Æ®¿öÅ·•½ºÅ丮Áö•¼ÒÇÁÆ®¿þ¾î¸¦ ÅëÇÕÇØ ½Ã½ºÅÛ Àü¹ÝÀÇ ¼º´É°ú È¿À²¼ºÀ» ±Ø´ëÈÇÑ´Ù. IDCÀÇ ÃÖ±Ù º¸°í¼1¿¡ µû¸£¸é, AI ÇÏÀÌÆÛÄÄÇ»Å͸¦ Ȱ¿ëÇÑ ±â¾÷ °í°´Àº 3³â°£ Æò±Õ 353%ÀÇ ROI¿Í 28%ÀÇ IT ºñ¿ë Àý°¨ È¿°ú¸¦ °æÇèÇßÀ¸¸ç IT ÆÀÀÇ È¿À²¼ºÀ» 55% Çâ»óÇÑ °ÍÀ¸·Î ³ªÅ¸³µ´Ù.
¾ÆÀ̾ð¿ìµå´Â ÃÖ´ë 9,216°³ÀÇ Ä¨À¸·Î ±¸¼ºµÈ ½´ÆÛÆ÷µå(superpod)·Î È®ÀåÇÒ ¼ö ÀÖÀ¸¸ç, Ãʰí¼Ó ÀÎÅÍĨ ÀÎÅÍÄ¿³ØÆ®(ICI) ³×Æ®¿öÅ· ±â¼ú·Î ¿¬°áµÅ 9.6Tb/sÀÇ Çõ½ÅÀûÀÎ ¼Óµµ¸¦ ±¸ÇöÇÑ´Ù. À̸¦ ÅëÇØ 1.77 ÆäŸ¹ÙÀÌÆ®(PB)ÀÇ °øÀ¯ °í´ë¿ªÆø ¸Þ¸ð¸®(HBM)¿¡ ¾×¼¼½ºÇØ º¹ÀâÇÑ AI ¸ðµ¨¿¡¼ ¹ß»ýÇÏ´Â µ¥ÀÌÅÍ º´¸ñ Çö»óÀ» ÃÖ¼ÒÈÇÑ´Ù.
À̿ܿ¡µµ ¾ÆÀ̾ð¿ìµå´Â ±¤È¸·Î ½ºÀ§Äª(Optical Circuit Switching, OCS) ±â¼úÀ» Àû¿ëÇØ ³×Æ®¿öÅ© Àå¾Ö°¡ ¹ß»ýÇØµµ ½Ç½Ã°£À¸·Î °æ·Î¸¦ À籸¼ºÇÏ¿© ¼ºñ½º Áß´Ü ¾øÀÌ ¿öÅ©·Îµå¸¦ º¹±¸ÇÒ ¼ö ÀÖ´Ù. ¼º´É Çâ»óÀÌ ÇÊ¿äÇÑ °æ¿ì¿¡´Â ¼ö½Ê¸¸ °³ÀÇ TPU¸¦ Ŭ·¯½ºÅÍ·Î È®ÀåÇÒ ¼ö ÀÖ¾î ¾ÐµµÀû ¼öÁØÀÇ Ãß·Ð ¼º´ÉÀ» ±¸ÇöÇÑ´Ù.
ÀÌ¹Ì ¼ö¸¹Àº ±Û·Î¹ú AI ¼±µµ ±â¾÷ ¹× ½ºÅ¸Æ®¾÷ÀÌ ¾ÆÀ̾ð¿ìµå¸¦ Ȱ¿ëÇØ ¸ðµ¨ ÇнÀ ¹× ¼ºñ½º È¿À²À» ±Ø´ëÈÇϰí ÀÖ´Ù. ¾ØÆ®·ÎÇÈ(Anthropic)Àº ¾ÆÀ̾ð¿ìµåÀÇ ¶Ù¾î³ °¡°Ý ´ëºñ ¼º´ÉÀ» ¹ÙÅÁÀ¸·Î ´ë±Ô¸ð Ŭ·Îµå(Claude) ¸ðµ¨ ÇнÀºÎÅÍ ¼ö¹é¸¸ ¸íÀÇ »ç¿ëÀÚ¿¡°Ô ¼ºñ½º¸¦ Á¦°øÇϱâ À§ÇÑ È¯°æ ±¸ÃàÀ» °¡¼ÓÈÇϰí ÀÖ´Ù. ¾ØÆ®·ÎÇÈÀº ÇâÈÄ ÃÖ´ë 100¸¸ °³ÀÇ TPU »ç¿ëÀ» °èȹÇϰí ÀÖ´Ù°í ¹àÇû´Ù.
¾×½Ã¿Â(Axion): ¹ü¿ë ÄÄÇ»ÆÃÀÇ »õ·Î¿î ±âÁØ
¸ðµ¨ ¾ÆÅ°ÅØÃ³, ¼ÒÇÁÆ®¿þ¾î, ±â¼úÀÌ ²÷ÀÓ¾øÀÌ º¯ÈÇÏ´Â ½Ã´ë¿¡ ±â¾÷ÀÌ ¼º°øÇϱâ À§Çؼ´Â ¸ðµ¨ ÇнÀ ¹× ¼ºñ½º¿¡ Æ¯ÈµÈ AI °¡¼Ó±â¿Í ÀÏ»óÀûÀÎ ¿öÅ©·Îµå¿¡ ÃÖÀûÈµÈ È¿À²ÀûÀÎ ¹ü¿ë CPU Á¶ÇÕÀÌ ÇÊ¿äÇÏ´Ù. ±¸±Û Ŭ¶ó¿ìµå´Â À̹ø ¹ßÇ¥¸¦ ÅëÇØ ARM ³×¿À¹ö½º(Arm Neoverse®) ±â¹Ý ¸ÂÃãÇü CPUÀÎ ‘¾×½Ã¿Â’ Á¦Ç°±ºÀ» È®ÀåÇß´Ù. ¾×½Ã¿ÂÀº ÀÏ»ó ¿öÅ©·Îµå¿¡ ¶Ù¾î³ ¼º´É, ºñ¿ë ¹× ¿¡³ÊÁö È¿À²¼ºÀ» Á¦°øÇÑ´Ù. ¾ÆÀ̾ð¿ìµå°¡ ¸ðµ¨ ¼ºñ½ºÀÇ º¹ÀâÇÑ ÀÛ¾÷À» ó¸®ÇÏ´Â µ¿¾È, ¾×½Ã¿ÂÀº °í¿ë·® µ¥ÀÌÅÍ Áغñ, ¼öÁý, Áö´ÉÇü ¾ÖÇø®ÄÉÀÌ¼Ç È£½ºÆÃ°ú °°Àº ¿î¿µ »óÀÇ ¹éº»(backbone) ¿ªÇÒÀ» ¼öÇàÇÑ´Ù.
À̹ø¿¡ ÇÁ¸®ºä ¹öÀüÀ¸·Î °ø°³µÈ N4A´Â ±¸±Û Ŭ¶ó¿ìµåÀÇ µÎ ¹øÂ° ¹ü¿ë ¾Ç½Ã¿Â VMÀÌ´Ù. N ½Ã¸®Áî Áß °¡Àå ºñ¿ë È¿À²ÀûÀÎ VMÀ¸·Î Çö ¼¼´ë µ¿±Þ x86 ±â¹Ý VM ´ëºñ ÃÖ´ë 2¹è ¿ì¼öÇÑ °¡°Ý ´ëºñ ¼º´ÉÀ» Á¦°øÇÑ´Ù. ¸¶ÀÌÅ©·Î¼ºñ½º, ÄÁÅ×À̳ÊÈµÈ ¾ÖÇø®ÄÉÀ̼Ç, ¿ÀǼҽº µ¥ÀÌÅͺ£À̽º, µ¥ÀÌÅÍ ºÐ¼® ¹× À¥ ¼ºñ½º ÀÛ¾÷ µî¿¡ ÀÌ»óÀûÀÌ´Ù.
¶ÇÇÑ ±¸±Û Ŭ¶ó¿ìµåÀÇ Ã¹ Arm ±â¹Ý º£¾î¸ÞÅ» ÀνºÅϽº(bare-metal instance)ÀÎ C4A ¸ÞÅ»(C4A metal)ÀÌ Á¶¸¸°£ ÇÁ¸®ºä ¹öÀüÀ¸·Î Ãâ½ÃµÉ ¿¹Á¤ÀÌ´Ù. C4A ¸ÞÅ»Àº ¾Èµå·ÎÀÌµå °³¹ß, Â÷·® ³» ½Ã½ºÅÛ, ¾ö°ÝÇÑ ¶óÀ̼±½º°¡ ÇÊ¿äÇÑ ¼ÒÇÁÆ®¿þ¾î, º¹ÀâÇÑ ½Ã¹Ä·¹ÀÌ¼Ç ½ÇÇà°ú °°Àº Àü¹®ÈµÈ ¿öÅ©·Îµå¸¦ À§ÇÑ Àü¿ë ¹°¸® ¼¹ö¸¦ Á¦°øÇÑ´Ù.
±¸±Û Ŭ¶ó¿ìµå´Â ¾×½Ã¿Â Æ÷Æ®Æú¸®¿À¿¡ N4A, C4A, C4A ¸ÞÅ»À» Æ÷ÇÔÇÑ ¼¼ °¡Áö ¿É¼ÇÀ» Á¦°øÇÔÀ¸·Î½á, °í°´ÀÌ ¿øÇÏ´Â ¼º´É°ú ¿öÅ©·Îµåº° ¿ä±¸»çÇ׿¡ ºÎÀÀÇϸ鼵µ ºñÁî´Ï½º ¿î¿µÀÇ ÃÑ ºñ¿ëÀ» ³·Ãâ ¼ö ÀÖµµ·Ï Áö¿øÇÒ °èȹÀÌ´Ù.
AI ÇÏÀÌÆÛÄÄÇ»ÅÍ: ´õ ºü¸£°í È¿À²ÀûÀÎ Çϵå¿þ¾î-¼ÒÇÁÆ®¿þ¾î °øµ¿ ¼³°è
±¸±Û Ŭ¶ó¿ìµå´Â ¾ÆÀ̾ð¿ìµåÀÇ Ã³¸® ´É·Â°ú ¸Þ¸ð¸®¸¦ ±Ø´ëÈÇÏÇÒ ¼ö ÀÖµµ·Ï, Çϵå¿þ¾î °³¹ß ´Ü°èºÎÅÍ ±× À§¿¡¼ ½ÇÇàµÉ ¼ÒÇÁÆ®¿þ¾î¸¦ ÇÔ²² ¼³°èÇÒ »Ó¸¸ ¾Æ´Ï¶ó ÃÖÀûÈ¿¡µµ ÁÖ·ÂÇϰí ÀÖ´Ù. À̴ Ĩ, ¸ðµ¨, ¿î¿µ ½Ã½ºÅÛ, °³¹ß ÇÁ·¹ÀÓ¿öÅ©±îÁö ¼öÁ÷ÀûÀ¸·Î ÃÖÀûÈµÈ ¾ÆÅ°ÅØÃ³¸¦ ÅëÇÕ ¼³°èÇÔÀ¸·Î½á, °í°´¿¡°Ô AI ¶óÀÌÇÁ»çÀÌŬ Àü¹Ý¿¡ °ÉÃÄ ÃÖ°í ¼öÁØÀÇ ¼º´ÉÀ» Á¦°øÇÏ´Â °ÍÀ» ÀǹÌÇÑ´Ù.
TPU °í°´Àº ÀÌÁ¦ ±¸±Û Äí¹ö³×Ƽ½º ¿£Áø(Google Kubernetes Engine, GKE)¿¡¼ Ŭ·¯½ºÅÍ µð·ºÅÍ(Cluster Director) ±â´ÉÀ» »ç¿ëÇÒ ¼ö ÀÖÀ¸¸ç, ¿ÀǼҽº LLM ÇÁ·¹ÀÓ¿öÅ©ÀÎ ¸Æ½ºÅؽºÆ®(MaxText)¿¡´Â ÃֽŠÇнÀ°ú °È ÇнÀÀ» ¿ëÀÌÇÏ°Ô ÇÏ´Â »õ·Î¿î ±â´ÉµéÀÌ Ãß°¡µÆ´Ù. ¶ÇÇÑ vLLM¿¡¼ TPU Áö¿øÀÌ °ÈµÅ °³¹ßÀÚ°¡ GPU¿Í TPU¸¦ ½±°Ô ÀüȯÇϰųª ÇÔ²² ½ÇÇàÇÒ ¼ö ÀÖÀ¸¸ç, GKE Ãß·Ð °ÔÀÌÆ®¿þÀÌ(GKE Inference Gateway)´Â TPU ¼¹ö °£ ·Îµå ¹ë·±½ÌÀ» ÅëÇØ TTFT(Time-to-First-Token, ÃÖÃÊ ÅäÅ« »ý¼º ½Ã°£)¸¦ ÃÖ´ë 96% °¨¼ÒÇϰí, ¼ºñ½º ºñ¿ëÀ» ÃÖ´ë 30% Àý°¨ÇÑ´Ù.
¸¶Å© ·Î¸ÞÀ̾î(Mark Lohmeyer) ±¸±Û Ŭ¶ó¿ìµå AI ¹× ÄÄÇ»ÆÃ ÀÎÇÁ¶ó ºÎ¹® ºÎ»çÀå °â ÃѰý ¸Å´ÏÀú´Â “¿¡ÀÌÀüÆ® ¿öÅ©ÇÃ·Î¿Í ÄÄÇ»ÆÃ ¼ö¿äÀÇ ±âÇϱ޼öÀûÀÎ Áõ°¡´Â ¿À´Ã³¯ Ãß·ÐÀÇ ½Ã´ë¸¦ »õ·Ó°Ô Á¤ÀÇÇϰí ÀÖ´Ù. ±¸±Û Ŭ¶ó¿ìµå´Â 10³â Àü óÀ½ ¼±º¸ÀÎ TPU¸¦ ºñ·ÔÇØ ÀÌ·¯ÇÑ ÀüȯÀ» ÀÌ¹Ì ¿À·¡ ÀüºÎÅÍ ´ëºñÇØ ¿Ô´Ù”¶ó°í ¼³¸íÇϸç, “Çϵå¿þ¾îºÎÅÍ ¼ÒÇÁÆ®¿þ¾î, °ü¸®Çü ¼ºñ½º±îÁö ±ä¹ÐÈ÷ ÅëÇÕµÈ Ç® ½ºÅà AI ÇÏÀÌÆÛÄÄÇ»Å͸¦ ¹ÙÅÁÀ¸·Î, ±¸±Û Ŭ¶ó¿ìµå °í°´Àº ¾ÆÀ̾ð¿ìµå¿Í ¾×½Ã¿ÂÀ» ºñ·ÔÇÑ ´Ù¾çÇÑ ÄÄÇ»ÆÃ ¿É¼ÇÀ» Á¶ÇÕÇØ °¡Àå ±î´Ù·Î¿î ¿öÅ©·Îµå¿¡µµ ÃÖÀûÀÇ À¯¿¬¼º°ú ¼º´ÉÀ» È®º¸ÇÒ ¼ö ÀÖÀ» °Í”À̶ó°í ÀüÇß´Ù.
|