ETRI, 초고성능 AI 연산시스템 개발...초당 5000조회 연산

ETRI, 초고성능 '아트브레인' 제작
자체 개발 NPU 반도체로 성과
연산 성능 4배·전력효율 7배↑
초거대 인공신경망 등 활용 기대

정부출연연구기관(출연연)이 인공지능(AI) 학습과 추론 연산을 저전력으로 급가속하는 시스템 개발에 성공했다. 자체 개발 AI 반도체를 활용, 이룬 성과다.

한국전자통신연구원(ETRI·원장 김명준)은 저전력으로 초당 약 5000조회 연산이 가능한 AI 시스템을 개발했다고 2일 밝혔다.

ETRI는 지난해 개발한 신경망처리장치(NPU) 기반 반도체 칩 알데바란9(AB9)을 활용해 보드와 AI 시스템을 개발했다. NPU는 뇌 신경망을 모방해 AI 알고리즘 연산에 최적화된 대규모 연산 동시 처리 프로세서다. 근래 차세대 AI 두뇌로 떠오른다.

개발 성과는 각종 AI 응용 서비스를 제공하는 고성능 서버에 활용하기 위한 것이다. NPU 보드 'ABrain-S'는 부피가 작으면서 전력소모도 낮다. AI 알고리즘 처리를 위한 입출력 데이터를 16기가바이트(GB)까지 저장할 수 있는 메모리, 데이터 이동속도를 가속하는 인터페이스도 적용했다.

ETRI가 개발한 NPU보드 A-Brain-S와 이들이 집약된 서버노드.
ETRI가 개발한 NPU보드 A-Brain-S와 이들이 집약된 서버노드.

기존 GPU 보드는 1개 서버 노드에 6~7개밖에 장착할 수 없는 반면, AB9 내장 NPU 보드는 최대 20개 장착이 가능하다. 동전 크기 면적으로 초당 40조회 연산 성능을 낸다. 전력 소모도 15W 수준으로 매우 낮다.

ETRI는 이를 바탕으로 서버 노드 8개를 쌓아 '렉 서버' 형태로 구성된 AI 시스템 '아트브레인(ArtBrain-K)'을 만들었다. 최대 5페타플롭스(PF) 성능을 낸다. 서버 1개당 1초에 5000조회 연산이 가능하다. 기존 GPU 기반 AI 서비 대비 4배 연산 성능, 7배 전력효율을 낸다. 데이터센터에 적용하면 처리용량, 속도를 대폭 개선할 수 있다. '초거대 인공신경망(HNN)' 등 막대한 컴퓨팅 자원이 필요한 곳에 활용할 수 있다.

ETRI는 AI 알고리즘을 쉽게 개발할 수 있도록 소프트웨어(SW) 개발환경 도구인 'AI웨어RT(AIwareRT)'도 깃허브에 공개했다.

ETRI 연구진이 아트브레인 서버를 점검하는 모습
ETRI 연구진이 아트브레인 서버를 점검하는 모습

한진호 ETRI 인공지능프로세서연구실장은 “AI 반도체 자체 개발로 비메모리 반도체 분야 원천기술을 보유하게 됐다”며 “AI 반도체를 탑재한 NPU 보드와 NPU 서버시스템 및 관련 SW까지 개발해 기술 경쟁력을 높이는 데 성공했다”고 말했다.

현재 이 기술은 반도체 기업 및 AI 하드웨어(HW) 기업 등에 이전, 공항 자동 출입국 시스템에 적용되돼 얼굴인식 및 출입국 보안에 활용되고 있다. 향후 연구진은 기술을 더욱 고도화해 더 높은 성능을 지닌 서버·시스템을 구축할 예정이며, 딥러닝이 적용되는 AI 분야 부품 국산화를 위한 지원도 진행할 계획이다.

이번 연구는 과학기술정보통신부 '인공지능프로세서 전문연구실' 과제 일환으로 수행됐다. 연구진은 저전력에서 높은 성능을 내는 기술, 메모리 지연을 낮추는 기술 등 특허 출원 및 등록 32건, 관련 논문 5건, 기술이전 4건 성과를 얻었다.


대전=김영준기자 kyj85@etnews.com