quickmenu
PC 뉴스 홈  

마이크로소프트AI, 인간 수준의 이미지 묘사능력 구사한다

2020-10-20 17:12
편집부 press@bodnara.co.kr

마이크로소프트가 이미지 캡셔닝(Image Caption) AI(인공지능) 기술을 인간 수준으로 고도화하고, 이를 모든 사용자들이 더 쉽게 사용할 수 있도록 지원한다.

 

알트 텍스트(alt text)로 알려진 마이크로소프트 이미지 캡셔닝 기술은 다양한 이미지를 인식 및 분석해 콘텐츠를 자연어로 해설해 주는 기술이다. 2015년부터 활용된 이 기술은 이번 업데이트로 사람과 비슷한 수준에 도달했고, 자동화를 통해 검색 엔진부터 프레젠테이션에 삽입된 이미지까지 중요한 콘텐츠를 쉽게 이해할 수 있도록 한다.

마이크로소프트는 이러한 기술 향상을 그림책과 유사하게 시각적 어휘(visual vocabulary)를 사용했다. 먼저 대규모 AI 모델에 단순 어휘들이 태깅된 이미지들을 다량의 데이터 세트로 제공했다. 각각의 태그는 이미지의 특정 개체에 매핑해 사전교육을 시켰고, 정밀교정을 거쳐 문장 작성법을 학습하도록 했다. 마치 아이들이 언어를 익힐 때 사과 사진 밑에 사과라는 단어를 다는 것과 유사하다.

이 방식은 완성된 문장을 사용하는 훈련 보다 더욱 효과적인 결과를 만들어냈다. 이를 통해 새로운 개체가 포함되어 있는 사진들도 시각적 어휘를 사용해 보다 정확한 캡셔닝이 가능해 졌으며 지난 2015년부터 사용해 온 모델 대비 2배 향상됐다. 예를 들어 아래 사진을 과거에는 빌딩 옆 스케이트보드를 타는 사람으로 설명했다면, 현재는 공을 잡는 야구선수로 보다 정확한 캡셔닝을 보여준다.

이 외에도 곡물 확대 사진에서 들판 속 보리 확대 사진으로, 산 정상 위 남자에서 서핑 보드를 들고 있는 남성으로 보다 구체적이고 정확한 성공적인 이미지 묘사 사례들도 함께 볼 수 있다.

업그레이드된 이미지 캡셔닝 기술은 현재 애저 코그니티브 서비스(컴퓨터 비전)을 통해 사용 가능하다. 올해 말에는 윈도우(Window) 및 맥(Mac) 환경의 워드, 아웃룩, 파워포인트 등에서도 사용 가능하며, 파워포인트는 웹 환경에서도 제공된다.

또 시각장애인에게 주변 환경, 인물, 사물, 글자, 이미지 등을 설명해 주는 모바일 애플리케이션인 시각 AI(Seeing AI)와도 통합된다. 이를 통해 시각 장애인이나 시력이 좋지 않은 사람들에게 사진을 묘사해주는 등 보다 정확하고 풍부한 정보 전달로 더 효과적인 도움을 줄 수 있게 되었다.

닉네임 lock
비회원

보드나라 많이 본 뉴스
보드나라 많이 본 기사

보드나라 최신 기사
[10/20] 앱코, 진동과 가상 7.1 채널을 탑재한 게이밍 헤드셋 ‘N999’ 출시  
[10/20] MSI, 컴퓨텍스 2025서 AI 노트북 핸드헬드 신제품 공개  
[10/20] HP, ‘Victus Gaming Laptop 15-fb3113AX’ 출시.. 고성능 가성비 겸비한 게이밍 노트북  
[10/20] 이엠텍아이엔씨가 공식 유통하는 PALIT과 SAPPHIRE, COMPUTEX 2025 참가  
[10/20] 퀄컴, 멀티미디어 경험 강화된 스냅드래곤 7 Gen4 발표  
[10/20] 넥슨, ‘마비노기 영웅전’ 오케스트라 공연 6월 21일 개최  
[10/20] '프리미엄한 당신을 위한 최고의 선택' 삼성스토어, '데이코 위크' 진행  
[10/20] 넷마블 북미 자회사 카밤, <마블 올스타 배틀> PC 버전 전 세계 정식 출시  
[10/20] '월드 오브 워쉽' x 벽람항로 일곱 번째 콜라보레이션  
[10/20] GTA 온라인, FIB 파일 피날레에서 보상 두 배 제공  
[10/20] 넥슨, 메이플스토리M M4U 아일랜드 2차 이벤트 실시  
[10/20] 운빨존많겜, 출시 1주년, 역대급 업데이트와 이벤트 쏟아진다!  
[10/20] 서린컴퓨터, 시스템 빌드 전문 유튜버와 협업한 'PC SNAP 에디션' 출시  
[10/20] 펀키스, 31g 초경량 마그네슘 합금 8K 게이밍 마우스 WLMouse Beast Miao 시리즈 출시  
[10/20] Razer, 생산성과 게이밍 동시에 잡은 3종 키보드 마우스 출시  
[10/20] 디아블로 IV, 2025 세계 접근성 인식의 날 기념해 누구나 손쉽게 성역을 탐험하도록 돕는 기능 소개하는 영상 공개  
[10/20] 마우저, 첨단 비전 AI 기술을 지원하는 르네사스의 RZ/V2N 마이크로프로세서 공급  
[10/20] MSI, AI 게이밍 모니터 분야 선도  
[10/20] 삼성전자, AI 기능 탑재한 'AI 통버블 세탁기' 출시  
[10/20] 라이엇 게임즈, 발로란트 출시 5주년 기념 ‘자선 // V25 세트‘ 출시  
로그인 | 이 페이지의 PC버전
Copyright NexGen Research Corp. 2010