TPC의 IoT 데이터 처리 분야 3회 연속 우승과 표준 등재

[테크월드=김경한 기자] 

“안 써본 사람은 있어도 한 번만 써본 사람은 없다.”
김성진 마크베이스(Machbase) 대표는 자사의 시계열 데이터베이스 관리 시스템(Time Series DBMS, 이하 시계열 DBMS)인 ‘마크베이스’의 우수성을 이와 같은 시쳇말로 소개했다. 시계열 DBMS는 4차 산업혁명 시대에 주도권을 확보하기 위해 도입이 늘고 있는 스마트X(스마트빌딩, 스마트홈, 스마트팜 등)의 산업용 IoT 장비와 센서로부터 생성되는 태그 데이터를 실시간으로 수집, 저장, 처리할 수 있는 소프트웨어다. 마크베이스는 국제 공인 성능 인증 기관인 TPC로부터 IoT 데이터 처리 분야에서 1위를 차지했을 정도로 성능의 우수성을 국제적으로 인증받았다. 그럼에도 아직 국내에는 시계열 DBMS 개념 자체가 생소한 것이 사실이다. 김성진 대표를 만나 시계열 DBMS의 개념과 필요성에 대해 들어봤다. 

김성진 마크베이스 대표

초당 수백 만 건의 데이터 처리

온 세상이 인터넷으로 연결되고, 한 손으로도 쉽게 들고 다닐 수 있는 스마트기기가 등장하며, 정보를 실시간으로 감지할 수 있는 첨단센서가 발달하면서 찰나의 순간에도 무수히 많은 데이터가 쏟아져 나오고 있다. 가히 빅데이터라는 말이 실감나는 세상에 살게 된 것이다. 하지만 유튜브에 수많은 영상물이 쏟아져 나와도 확인조차 못하는 경우가 흔한 것처럼, 산업현장에서는 초당 수 백만 건의 데이터가 쏟아져 나오고 있지만 이를 처리할 수 없어 그냥 버려지는 실정이다. 한 첨단 제조업체에서는 초당 7000만 건 이상의 데이터를 처리해야 하는 상황에 이르렀다는 소식도 들린다.

이는 간단한 산수만 적용해도 엄청난 양이라는 것을 알 수 있다. 1초에 100만 개의 데이터가 쌓여도 일주일이면 약 6000억 개의 데이터가 쌓이게 된다. 하지만 지금까지 많이 활용되고 있는 관계형 데이터베이스 관리 시스템(Relational Database Management System, 이하 RDBMS)은 데이터가 초당 수만 건만 돼도 처리하지 못하는 한계점을 드러내고 있다. RDBMS는 모든 데이터를 행과 열의 테이블로 저장하고 처리하는 시스템을 말하며, 대표적으로 오라클과 MS SQL 서버가 있다. 

이를 극복할 수 있는 대안으로 최근 각광받고 있는 데이터베이스 처리 솔루션이 시계열 DBMS다. 시계열 DBMS는 데이터를 시계열(일정 시간 간격으로 배치된 데이터의 수열)로 저장하고 처리하는 시스템이다. 

DBMS 트렌드 (자료=DB 엔진)

김성진 대표는 “오라클이나 MS SQL과 같은 RDBMS는 주로 사람이 만든 데이터, 즉 은행 거래 기록이나 통신 기록과 같은 사람이 만든 비정형 데이터를 저장하고 처리하는 데이터베이스 관리 시스템이다. 문제는 RDBMS가 공장에서 쏟아져 나오는 수많은 데이터를 처리하지 못해 그냥 버리고 마는 데 있다”고 주장했다. 이어 “마크베이스의 시계열 DBMS는 초당 100만 개 이상의 데이터를 처리하기 때문에 스마트X 분야에서 유용한 데이터베이스 관리 시스템”이라고 강조했다. 

이 기술 자체가 아직 초기 단계라 전 세계적으로 관련 회사가 20여 군데밖에 되지 않는다. 실제로 상용화 제품을 보유한 업체는 3군데 정도로, 이 중 한 기업이 마크베이스다. 

마크베이스는 지난 4월 13일에는 TPC의 IoT 부문 성능 테스트에서 1위를 기록했으며, 2019년 11월 첫 인증 참가 이후 3회 연속 신기록 경신 행렬을 이어가고 있다. 마크베이스는 올해 AMD CPU가 탑재된 슈퍼마이크로 A+ 서버로 2차례에 걸쳐 IoT 테스트에 참가해 초당 219만 9052(1회차)개와 248만 917(2회차)개의 데이터를 처리했다. 이는 마크베이스가 직전에 세운 초당 104만 3276개의 데이터 처리 능력을 200% 이상 상회하는 기록이며, 여타 DBMS 대비 최소 3배에서 최대 17배를 상회하는 수치다. 

TPCx-IoT 성능 평가 결과 (자료= TPC.org)

이처럼 국제적으로도 성능을 검증받은 마크베이스의 가장 큰 특징은 IoT 센서 데이터를 고속으로 처리하는 것으로, 일반 서버급 환경에서도 초당 수백 만 건의 데이터를 저장과 동시에 처리할 수 있다. 이런 성능 덕분에 스마트제조, 스마트시티, 스마트물류, 기상예측, 에너지·전력 관리, 빌딩관리, 환경관리, 수자원관리 등 IoT 분야의 효과적 관리·분석·예측을 위한 분야에서 마크베이스의 선전이 이어지고 있다. 반도체, 제철, 엔지니어링, 원자재 무역, 네트워크보안 분야의 대기업이 이미 마크베이스의 주요 고객이다.

 

스마트팩토리의 ‘핵심키’

김성진 대표는 한 공작기계 제조업체 방문했다가 전해들은 이야기를 통해 시계열 DBMS의 필요성을 설명했다. 이 회사의 개발자의 말에 의하면, 밀링머신 생산 장비의 수율 향상을 위해서는 수많은 센서 정보를 분석하기 위한 데이터를 저장하고 처리하는 기술이 필요했다. 하지만 초당 수십만 건씩 생성되는 데이터를 처리할 수 없어 기존에는 그냥 방치해 왔는데, 마크베이스의 시계열 DBMS를 활용하면서부터 이를 활용할 수 있게 됐고, 이 기술이 스마트팩토리의 ‘핵심키’라는 점을 깨달았다고 한다. 

스마트팩토리를 운영하기 위해서는 크게 3단계의 계층이 필요하다. ▲데이터를 수집하는 하드웨어 계층 ▲데이터를 저장·처리하는 데이터베이스 계층 ▲테이터를 분석하고 시각화하는 계층이 그것이다. 이중 마크베이스는 데이터베이스 계층에 속한다. 여기에서 알 수 있듯, 마크베이스만의 특화 기술은 대량의 데이터를 빠르게 저장할 수 있게 하는 기술과 그렇게 모인 빅데이터에서 필요한 데이터만을 빠르게 찾아낼 수 있게 처리하는 기술이다. 이 기술을 바탕으로, 첫 번째 계층의 물리적 하드웨어가 데이터를 효율적으로 저장하고, 세 번째 계층의 분석·시각화 영역이 데이터를 분석할 수 있게 되는 것이다. 

김 대표는 “3개의 계층 중 데이터베이스 영역을 빼고는 아무런 문제가 없다”고 역설했다. 하드웨어를 만들거나 데이터베이스를 분석하는 회사가 많기도 하거니와 이 분야의 인재도 많기 때문이다. 하지만 데이터베이스 분야는 ‘소프트웨어 종합예술’이라 불릴 정도로, 개발 전에 알아야 하는 사전지식의 영역도 넓고 무엇보다도 개발기간이 길어 극소수의 기업만 살아남는다. 마크베이스도 현재의 성능을 보유한 제품을 만들기까지 창립년도(2013년)부터 6~7년의 기간을 소요했으며, 거래처를 트기 시작한 시기는 2년 전인 2018년에 불과하다. 제품 개발에 쓰인 돈만 자본금, 투자금, 과제금을 합쳐 100억 원이 넘을 정도다. 단기 성과에만 급급한 국내의 개발 현실에서 김성진 대표의 개발자로서의 뚝심이 없었다면 불가능했으리라 여겨진다. 

 

마크베이스가 쏘아올린 DB 처리 개발기

김성진 대표는 마크베이스를 설립하기 전부터 개발자로서 잔뼈가 굵은 인물이다. 그는 경북대학교에서 컴퓨터과학과 데이터베이스 전공으로 석사를 졸업한 후 개발자로서 사회생활을 시작했다. DBMS 기술의 중요성과 국산화의 가치를 깨달은 후에는 알티베이스로 자리를 옮겨 인메모리 DBMS와 하이브리드 DBMS 개발을 주도했다. 이를 바탕으로 2006년에는 정보통신부(현 과학기술정보통신부)가 주최하는 신소프트웨어대상 대통령상을 수상했으며, 알티베이스 내에서는 개발과 사업화 역량을 인정받아 CTO와 CEO를 역임했다. 

그러던 중, 김성진 대표는 전통적인 DBMS는 IoT 환경에서 기계가 만드는 데이터베이스를 빨리 처리하지 못한다는 문제를 발견했다. 머지 않은 미래에 사람들이 이에 대한 대안을 찾을 것이라는 생각에 이르렀고, 2013년 인피니플럭스(현 마크베이스)를 창업해 시계열 DBMS 개발에 나섰다. 하지만 개발이 녹록치는 않았다. 개발을 하더라도 상용화하기가 쉽지 않은 게 현실이었다. 그래서 김 대표는 DBMS를 ‘인공위성’에 비유한다. 오랜 기간 개발해야 하는데 지금 당장 성공할지 실패할지도 알 수 없고, 철저한 점검 후 대기권 밖으로 쏘아 올린 후에야 결과를 확인할 수 있는 인공위성과 같은 개발 열정과 기술력이 필요하기 때문이다. 

다행히 결과는 대만족이었다. 현재 국내에서 20~30여 곳의 제약, 자동차, 반도체 회사가 마크베이스의 제품을 채택해 사용하고 있으며, 미국 실리콘밸리에 본사를 둔 모니터링 시스템 전문기업 SL 코퍼레이션에는 OEM으로 자사 제품을 공급하고 있다. 2019년 11월 28일에는 마크베이스가 시계열 DBMS인 ‘마크베이스 v5.0’로 ‘제6회 대한민국 SW제품 품질대상’에서 대상을 수상하기도 했다. 

그는 대표이기 전에 개발자였기에 개발자의 마음을 누구보다 잘 안다. 그래서인지 회사를 방문해 보면 이색적인 광경이 눈에 띈다. 회사 현관을 지나면 한쪽 수납장을 가득 채운 과자봉지가 보이고 그 옆으로는 1970~80년대 오락실에서 보던 오락기가 놓여 있다. 개발에 전념하다 지친 개발자들이 잠시 쉴 수 있도록 마련한 휴식공간을 마련한 것이다. 회의실 이름은 개발자들의 투표로 정했다. 그래서 사무실의 오른쪽 회의실 공간은 테슬라룸, 아마존룸, 애플룸이, 왼쪽은 노이만룸, 리눅스룸, 게이츠룸이 연달아 붙어있다. 당시 투표에서는 천재 물리학자 폰 노이만의 이름이 가장 많이 나왔다고 한다. 

마크베이스의 회의실 이름은 개발자들의 투표로 결정됐다

TPC의 IoT 국제 표준 등재

2019년 11월 11일, 마크베이스의 시계열 DBMS는 HBase(하둡)와 함께 TPC의 IoT 데이터 처리 분야에서 국제공인을 획득했고 국제 표준에 등재됐다. 이로써 국산 DBMS 제품의 우수성을 해외에 알리는 기회가 됐을 뿐만 아니라, 해외 서버 벤더사들이 IoT 분야에 국산 DBMS 제품을 채택할 수 있는 기반을 마련했다. 김성진 대표는 마크베이스가 국내 IoT 데이터베이스 처리 분야에서도 표준으로 자리잡길 바라고 있다. 표준이 정해짐으로써 비효율적인 요소도 사라지고 국산 소프트웨어 진흥도 일어날 것으로 기대하기 때문이다. 

현재 마크베이스는 시계열 DBMS가 가장 발달한 미국 캘리포니아 산호세에 지사를 두고 있다. 더 나아가 제조업 강국인 중국에도 지사를 설립할 계획이다. 중국은 성 하나에서 모을 수 있는 데이터가 우리나라 전체와 견줄 정도다. 지리적으로도 가까워서 기술지원이나 기술미팅에도 발빠르게 대응할 수 있다. 

김성진 대표는 “마크베이스는 IoT 빅데이터 시대를 위한 혁신적인 기업용 소프트웨어를 개발하고, 고객 비즈니스 가치 창출의 핵심 주역이 될 것”이라고 밝혔다. 이를 위해 이제 막 도입기에 접어든 시계열 DBMS의 저변을 확대하는 일에 주력하고 있다. 새롭게 선보인 ‘마크베이스 v6.0’으로는 초당 최대 1억 건의 데이터 저장과 처리에 도전하고 있다. 

두 스텝 빠르게 나아가는 마크베이스를 취재하며 현재보다 더 밝은 미래를 보장받고 있다는 느낌이 들었다. 데이터 확보와 활용이 무기가 되는 4차 산업혁명 시대인 만큼, 머지않아 산업계의 신흥 강자로 발돋움할 마크베이스의 앞날을 기대해 본다. 

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지
이 기사와 관련된 기사