quickmenu
PC 뉴스 홈  

엔비디아, 힌디어용 sLM 네모트론-4-미니-힌디-4B 공개

2024-10-28 10:26
편집부 press@bodnara.co.kr

엔비디아가 힌디어를 위한 소형 언어 모델(small Language Model, sLM)인 네모트론-4-미니-힌디-4B(Nemotron-4-Mini-Hindi-4B)를 출시해 인도에서 맞춤형 언어 모델을 구축하고 있다고 밝혔다.

 

나마스테(Namaste), 바나캄(vanakkam), 삿 스리 아칼(sat sri akaal) 이 인사말들은 헌법에서 인정된 22개 언어와 인구조사에 기록된 1,500개 이상의 언어를 가진 인도에서 사용하는 3가지 인사말에 불과하다. 인도의 인구 약 10%는 인터넷에서 가장 많이 사용되는 언어인 영어를 사용한다.

세계에서 가장 인구가 많은 국가인 인도는 급속한 디지털화에 앞장서고 있다. 또한, 인도 기업과 현지 스타트업은 더 많은 인도인이 모국어로 기술과 상호작용할 수 있도록 다국어 AI 모델을 개발하고 있다. 이는 현지 데이터 세트를 기반으로 구축되고 지역의 특정 방언, 문화, 관행을 반영하는 국내 AI 인프라를 개발하는 소버린 AI의 사례다.

이러한 프로젝트들은 인도어와 영어를 위한 언어 모델을 구축해 기업용 고객 서비스 AI 에이전트를 강화한다. 아울러 콘텐츠를 신속하게 번역해 정보에 대한 접근성을 넓히고, 14억 명이 넘는 다양한 사람들에게 보다 쉽게 서비스를 제공할 수 있도록 지원하고 있다.

엔비디아(NVIDIA)는 이러한 이니셔티브를 지원하기 위해 인도에서 가장 보편적이며 5억 명 이상이 사용하고 있는 힌디어를 위한 sLM인 네모트론-4-미니-힌디-4B를 출시했다. 현재 엔비디아 NIM 마이크로서비스로 제공되는 이 모델은 모든 엔비디아 GPU 가속 시스템에 쉽게 배포돼 성능을 최적화할 수 있다.

인도의 IT 서비스와 컨설팅 회사인 테크 마힌드라(Tech Mahindra)는 힌디어와 수십 개의 방언에 초점을 맞춘 인더스 2.0(Indus 2.0)이라는 AI 모델을 개발하기 위해 네모트론 힌디 NIM 마이크로서비스를 최초로 사용했다. 인더스 2.0은 테크 마힌드라의 고품질 미세 조정 데이터를 활용해 모델 정확도를 높임으로써 은행, 교육, 의료, 기타 산업 분야의 고객이 현지화된 서비스를 제공할 수 있는 기회를 열어준다.

테크 마힌드라는 지난 10월 23일부터 25일까지 뭄바이에서 진행된 엔비디아 AI 서밋(AI Summit)에서 인더스 2.0을 선보였다. 아울러 회사는 자체 소버린 거대 언어 모델(Large Language Model, LLM) 플랫폼인 테노(TeNo)를 개발하는 데 엔비디아 네모(NeMo)를 사용한다.

네모트론 힌디 모델은 40억 개의 파라미터를 가지고 있으며, 엔비디아에서 개발한 150억 개의 파라미터를 가진 다국어 언어 모델인 네모트론-4 15B에서 파생됐다. 이 모델은 생성형 AI 개발을 위한 엔드투엔드 클라우드 네이티브 프레임워크이자 마이크로서비스 제품군인 엔비디아 네모를 사용했다. 이를 통해 실제 힌디어 데이터, 합성 힌디어 데이터와 동일한 양의 영어 데이터를 조합해 정제와 추출, 훈련을 수행했다.

이 데이터 세트는 고품질 멀티모달 데이터를 대규모로 처리해 훈련과 사용자 정의에 활용해 생성형 AI 모델의 정확도를 향상시키는 엔비디아 네모 큐레이터(NeMo Curator)로 제작됐다. 네모 큐레이터는 멀티노드 GPU 시스템에서 데이터 처리 파이프라인을 가속화해 처리 시간과 총소유비용을 낮추기 위해 엔비디아 래피즈(RAPIDS) 라이브러리를 사용한다. 아울러 고품질 데이터를 처리하기 위해 합성 데이터 생성, 데이터 필터링, 분류, 중복 제거를 위한 사전 구축된 파이프라인과 빌딩 블록을 제공한다.

네모로 미세 조정한 최종 모델은 최대 80억 개의 파라미터를 가진 AI 모델에 대한 여러 정확도 벤치마크에서 우수한 성능을 보이고 있다. 이는 NIM 마이크로서비스로 패키징돼 교육, 소매, 의료 등 다양한 산업 분야의 사용 사례를 지원하는 데 쉽게 활용될 수 있다.

또한, 이 모델은 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼의 일환으로 제공된다. 이를 통해 기업은 AI 개발을 프로덕션 환경에 맞춰 간소화할 수 있는 기술과 기업 수준의 보안을 비롯한 추가 리소스에 접근할 수 있다.

인도 전역의 혁신가, 주요 기업, 글로벌 시스템 통합업체는 엔비디아 네모를 사용해 맞춤형 언어 모델을 구축하고 있다.

첨단 스타트업을 위한 엔비디아 인셉션(Inception) 프로그램에 참여한 기업들은 여러 인도 언어에 대한 AI 모델을 개발하는 데 네모를 사용하고 있다.

사르밤 AI(Sarvam AI)는 기업 고객에게 음성 대 텍스트, 텍스트 대 음성 변환, 번역과 데이터 구문 분석 모델을 제공한다. 이 회사는 인도 최초의 자체 개발 다국어 LLM인 사르밤 1을 개발했으며, 이 모델은 엔비디아 H100 텐서 코어(Tensor Core) GPU로 구동되는 현지 AI 인프라에서 처음부터 훈련됐다.

네모 큐레이터와 네모 프레임워크 등 엔비디아 AI 엔터프라이즈 소프트웨어를 사용해 개발된 사르밤 1은 영어와 벵골어, 마라티어, 타밀어, 텔루구어 등 인도 주요 10개 언어를 지원한다.

또한 사르밤 AI는 엔비디아 NIM 마이크로서비스, 대화형 AI를 위한 엔비디아 리바(Riva), 엔비디아 텐서RT-LLM 소프트웨어, 엔비디아 트리톤 추론 서버(Triton Inference Server)를 사용해 1초 미만의 지연 시간으로 대화형 AI 에이전트를 최적화하고 배포한다.

또 다른 인셉션 스타트업인 지나니닷에이아이(Gnani.ai)는 다국어 음성 변환 LLM을 구축했다. 이 모델은 인도와 미국 전역의 150개 이상의 은행, 보험, 금융 서비스 회사에서 매일 약 천만 건의 실시간 음성 상호작용을 처리하는 AI 고객 서비스 비서를 지원한다. 이는 14개 언어를 지원하며 엔비디아 호퍼(Hopper) GPU와 네모 프레임워크를 사용해 1,400만 시간 이상의 대화 음성 데이터를 기반으로 훈련됐다.

지나니닷에이아이는 가상 고객 서비스 비서와 음성 분석을 위한 AI를 최적화하기 위해 텐서RT-LLM, 트리톤 추론 서버, 리바 NIM 마이크로서비스를 사용한다.

또한, 위프로와 TCS는 네모 큐레이터의 합성 데이터 생성 파이프라인을 사용해 영어 이외의 언어로 데이터를 생성해 고객을 위한 LLM을 맞춤화한다.

닉네임 lock
비회원

보드나라 많이 본 뉴스
보드나라 많이 본 기사

보드나라 최신 기사
[10/28] MSI, 2025 플레이엑스포 참가 기념 RTX 5090 래플 이벤트 진행  
[10/28] 효율적인 워크플로우 및 이미징 솔루션 전시, 소니코리아 KOBA 2025 현장 취재  
[10/28] 유니씨앤씨, 5월 21일 오전 11시, 네이버 x 삼성전자 갤럭시북5 아울렛위크 LIVE 진행]  
[10/28] MSI 모니터가 플레이엑스포에 떴다! AI 게이밍 시연부터 탐방 구매 혜택까지  
[10/28] MSI, 컴퓨텍스 2025서 미래 혁신 선도.. AI 기술과 협업, 신규 클로 전격 공개  
[10/28] MSI, 컴퓨텍스 2025에서 PC 조립 마니아를 위한 혁신적 신제품 공개  
[10/28] 제이씨현, UDEA 24형 IPS 144Hz FHD 모니터, ED2420GX 모니터 출시!  
[10/28] 에이수스, ‘컴퓨텍스 2025’서 AI 대중화 위한 차세대 혁신 기술 및 몰입형 게이밍 제품 대거 공개  
[10/28] 넷마블 <일곱 개의 대죄 키우기>, 신규 캐릭터 '방랑 무사 멜리오다스' 등 업데이트 진행  
[10/28] 서린컴퓨터,리안리 비전 시리즈 기반 완제품 PC 한정 특가 판매  
[10/28] 디앤디, GAINWARD 지포스 RTX 5060 고스트 D7 8GB 출시  
[10/28] 직접 경험하는 차세대 게이밍! MSI x NVIDIA 지포스 RTX 50 체험존 플레이엑스포에서 운영  
[10/28] 오버워치 2 x 스트리트 파이터 6 콜라보레이션 내일(21일) 시작  
[10/28] 제이씨현, 24형 144Hz 게이밍 모니터 출시 기념 99,000원 특가 행사 진행  
[10/28] ‘디자인을 말하고 기술로 증명한다’ 마이크로닉스, 컴퓨텍스 2025 전시회 참가  
[10/28] 제이씨현, GIGABYTE GeForce RTX 5060 시리즈 공식 출시  
[10/28] 차세대 성능의 기준, MSI 지포스 RTX 5060 시리즈 그래픽카드 출시  
[10/28] 엔비디아, 블랙웰·쿠다-X로 반도체 설계 제조 가속화  
[10/28] 커세어, 컴퓨텍스서 엔비디아 최신 GPU 최적화 PC 케이스 및 쿨링 솔루션 공개  
[10/28] HP 게이밍 노트북 오멘 16 쿠팡 사전예약 시작 프로모션  
로그인 | 이 페이지의 PC버전
Copyright NexGen Research Corp. 2010