정희석 파워보이스 대표

대한민국 음성인식기술의 선두주자

“핵심 원천기술 보유가 성공비결”

정희석 파워보이스 대표

지난달 14일 경기도 부천시 삼정동 테크노파크에 위치한 정희석 파워보이스 대표를 만났다. 2000년초반 벤처붐을 거쳐 벤처거품이 붕괴되며 하루에도 수십개의 기업이 도산하는 과정에서도 살아남았다. 이 회사가 살아남은 이유는 수많은 음성인식 제품을 뒤로하고 원천기술을 보유하고 있기 때문이다. 시장의 수요에 맞춰 원천기술을 적용한 응용제품을 내놓으며 생존했다. 그런 가운데 대부분의 이익을 R&D에 투자해 후발주자들과의 기술격차를 벌여놨다. 대한민국 음성인식 기술을 이끌고 있는 그의 얘기를 들어봤다. 

Q. 2002년에 창업했다. 
A. 학부에서 전자통신공학부를 전공했고 대학원에서 신호처리를 공부했다. 그 가운데 음성신호처리를 전공했고 박사과정에서 음성인식 등 인식분야를 공부했다. 박사 수료후 3년간 온세텔레콤의 합볍전 회사 ‘인피니티’에서 3년간 있었다. 이후 34살에 창업했다. 

Q. 자본금 마련은 어떻게 했나? 
A. 30대 중반에 보유중이던 아파트를 팔아서 월세로 전환했다. 그 돈으로 시작했다. 당시에 정부에서 벤처지원이 많았다. DJ정부에서 각 학교마다 창업지원센터가 있었다. 정보통신부와 중기청에서 적극적인 벤처지원을 하며 육성을 하던 시기라 어렵지 않았다. 

Q. 사람은 어떻게 모았나? 
A. 박사과정 연구실 후배 4명을 모아시작했다. 
Q. 음성인식 부정확하다는 선입견을 가지고 있다. 
A. 2000년 초반에 음성인식에 대한 붐이 일었다. 시장에 수요도 상당했다. 

Q. 국내 음성인식 기술의 시장수요는? 
A. 홈쇼핑, 고개센터 등 ARS 쪽에 음성인식 기술 수요가 집중돼 있다. 
이 모든 것을 인력으로 진행할 경우 인건비 부담에 따른 ROI(투자수익)가 안 나온다. 
음성인식 기술로 ARS를 대체하면 초기 시스템 도입비용은 들지만 시간이 지날수록 수익이 날 수밖에 없다. 
일본, 미국 같은 경우에는 음성인식 기술을 크게 불편해하지 않고 잘 사용한다. 
기계가 인식하지 못할 경우 인식할 때까지 또박또박 말하는 경향이 있다. 그러나 국내에서는 문화적으로 기계가 전화 받는 것 자체를 싫어한다. 이것이 상대적으로 음성인식 기술 확산에 제한요소로 작용하고 있다. 

정희석 대표가 “나래야 전체불켜!, 나래야 안방불꺼!, 나래야 전체불꺼”라고 명령하자 명령어에 따라 조명의 전원이 제어됐다. 이 장치에는 ‘상시대기음성인식’, ‘음파데이터통신(Sound QR)’, ‘원거리음성인식’ 기술이 적용됐다.


Q. 벤처거품이 무너지면서 어려움이 없었나? 
A. 2000년대 중반 벤처붐이 사그라지면서 많은 기업들이 도산했다. 가운데 운 좋은 회사는 인수합병 되기도 했다. 전체적으로 벤처지원 축소되면서 굉장히 큰 어려움이 발생됐다. 당시 협회에 방문해보면 파워보이스 포함해 음성인식 기술 기반으로 생존한 회사가 3~4개 밖에 안됐다. 

Q. 어떻게 사업을 꾸렸나? 
A. 처음 회사 설립 초기 ‘ITIC’라 불리는 연구센터에 지원을 많이 받았다. 그러한 지원으로 화자인식 기술을 전세계 최초로 상용화 시켰다. 
PC, 네트워크 보안, 인트라넷 보안 등 쉽게 말해 로그인 접속자 인식 기술을 보유하고 있다. 일본 ‘보이스K’란 이름으로 수출했다. 
작은 회사였지만 계속 매출이 발생돼 R&D를 할 수 있었다. 이후에 많은 경쟁기업들이 무너지면서 상대적으로 많은 기회를 얻을 수 있었다. 

Q. 타 경쟁업체와 어떻게 차별화에 성공했나? 
A. 2000년대 중반 다른 음성인식기술 업체들은 전화망이나 PC망에서 대용량 서버를 두고 음성인식을 하는 방향에 중점을 두고 제품 개발을 했다. 그러나 우리는 실제환경에서 잡음이 있는 상황에서 대화를 하고 음성 인식을 기술에 포커스를 맞추고 개발했다. 
이때 파워보이스의 핵심 원천기술인 원거리 음성인식기술 개발에 성공했다. CNN 등을 비롯한 외신을 비롯해 국내 언론을 통해 크게 보도됐던 카이스트 ‘휴보’ 로봇이 사람의 음성을 인식하고 대화하는 기술에 파워보이스의 원거리 음성인식기술이 적용됐다. 

카이스트 로봇 ‘휴보’와 오준호 교수의 대화를 나누는 장면은 전세계 언론에 관심을 받았다. 여기에 파워보이스 ‘원거리 음성인식기술’이 적용됐다.

Q. 어떤 방식으로 상용화 됐나? 
A. 이 기술이 상용화되면서 2005~ 2007년사이에 건설업체들이 새로운 홈네트웍스 기반으로 주택시장 붐을 일으키던 시절이었다. 
홈네트웍스 기반으로 주택시장 붐을 일으키던 시절이다. 
집안내에 홈네트웍스 장치를 두고 조명 제어, 보일러 제어, 도시가스 제어, 전력 제어 등을 명령어 기반의 원거리 음성인식 기술을 기반으로 서비스 됐다. 이 시절 현대건설, GS 자이, 삼성 레미안 등 국내 굴지의 건설업체와의 제휴로 자사의 음성인식 기술이 사용됐다. 당시 3만여세대까지 상용화가 됐다. 
2008년 이후 美 서브프라임 등 경제위기 등을 겪으며 주거비 부담을 완화하는데 주택시장의 마케팅 포인트가 변했다. 
그것이 ‘스마트그리드’ 시장이다. 이때 홈네트웍스시장은 상당부분 축소됐다. 

Q. 홈네트웍스 시장 축소 이후엔 어떻게 사업을 꾸렸나? 
A. 이후 자동차에 음성인식 기술이 상당부분 적용됐다. 국내 왠만한 자동차 옵션으로 음성인식 기술 한 두 가지씩은 들어간다고 보면 된다. 
현재 현대차는 외국기업의 음성인식기술을 사용하고 있지만 당시만 해도 자사와 공동개발해 기술을 적용했다. 
현재 르노삼섬 자동차의 경우 생산되는 전모델에서 자사의 기술이 사용되고 있다. 

Q. 어떤 기술이 자동차에 적용되나? 
A. 현재는 차량 탑재 네비게이션에 파워보이스 음성인식 기술이 탑재돼 있다. 자동차업계가 보수적이기 때문에 아주 제한적으로 적용되고 있다. 그 외에도 오디오, 블루투스 링크 전화기에서 전화번호부 찾기 등에 해당기술이 사용되고 있다. 자동차업체측에서 안전과 관련된다고 생각하는 분야에는 기술적용을 꺼리고 있다. 현재 적용되는 기술이 제한적이기 때문에 앞으로 더 많은 기술개발을 해야 하는 상황이다. 

정희석 파워보이스 대표(우측)와 박준열 한라마이스터 대표가 지난 2013년 조수석이나 뒷자리에서 스마트폰으로 목적지를 검색하여 음파로 내비게이션에 전송하는 MANDO Send to 사업에 대한 협약을 체결하는 모습.

Q. 요즘 차량은 대부분 전장화돼 있다. 가속패달, 브레이크 등 전기적 신호를 주고 받으며 통제가 된다. 음성인식 기술이 차량내에서 전파방해·신호교란 등을 일으켜 안전문제가 발생할 가능성은 없는가? 
A. 그런건 없다. 이것은 오디오데이터이기 때문에 전장에 문제를 일으킬 가능성은 극히 제한적이다. 

Q. 자동차분야에 음성인식기술이 확대 적용될 것으로 보는가? 
A. 음성인식기술이 가장 많이 필요한 분야가 자동차라고 판단한다. 운전자의 두 손은 핸들을 잡아야 하고 시선은 전방주시를 해야 한다. 전방주시가 안될수록 사고 위험이 높아진다. 

Q. 이 홈네트웍스가 진보한 것이 요즘의 IoT(사물인터넷) 인가? 
A. 그렇다. 예전에 아파트단지에 인터넷라인이 들어왔다. 아파트단지내 서버관제실을 하나두고 메일 체크, 출입통제 등을 하나로 묶어 홈네트워크로 서비스했던 것이다. 그러나 요즘은 모바일 기기의 발달로 그러한 시설이 불필요해졌다. 아파트 단지를 벗어나 모바일 기기 하나면 서비스가 가능한 시대가 됐다. 그것이 사물인터넷이다. 

Q. IoT 시대를 맞이해 어느정도 준비돼 있나? 
A. SKT IoT 협력업체로 있다. 또 자체적으로도 IoT플랫폼을 개발했다. 온·오프라인으로 B2C로 직접 판매도 하고 있다. 집 안팎에서 스마트폰으로 전원·조명 제어가 가능한 제품이다. 
집안에서는 스마트폰 없이도 제어가 가능하다는 것도 특징이다. 6만원에 구입이 가능하다. 모든 가정에 적용할 수 있다. 지금은 스마트폰 인간-기계 사이를 연결하는 가장 기초적인 기술이다. 구글과 같은 글로벌 기업들은 UI·UX에 어떻게 혁신을 가져올거냐에 대해 집중적인 연구를 하고 있다. 거기에 맞춰 우리도 수준을 높이며 연구개발을 하고 있다. 

Q. 상시대기음성인식 기술을 선보였는데 이 기술이 적용되는 곳은? 
A. LG전자에 에어컨에 음성인식기술을 적용했다. 에어컨 설치 위치가 집안 구석에 있고 4계절 사용가전이 아니다보니 리모컨 분실, 건전지 방전 등으로 불편함이 많았다. 그러나 현재는 최상위 프리미엄급 제품에만 적용돼 있다보니 판매수량 자체가 많지 않다. 
또 해외 판매제품 가운데는 LG전자에서 보급형으로 나온 벽걸이 에어컨에 음성인식기술을 적용해 동남아 등 제3세계 시장으로 수출하고 있다. 
파워보이스에서는 태국어나 베트남어 등 제3세계 언어로 음성인식을 구현해서 제품을 탑재하고 있다. 

정희석 대표가 파워보이스가 보유한 음성인식 IoT 기술을 시연하고 있다.

Q. 외국어는 언어체계가 다른데 음성인식기술 적용에 어려움이 없나? 
A. 인공지능으로 대화하는 것이 아니라 정해진 몇 가지 언어로 명령을 내리는 것에 불과하기에 기술구현에 어려움은 없다. 

Q. 원거리 음성인식기술 구현의 어려움은? 
A. 실제 환경에서 끊임없이 발생하는 소음·잡음에 기계가 오작동하지 않도록 하는 것이 중요하다. (상시대기음성인식 기계를 가리키며) 
현재도 모든 소리를 인식하고 있는 상태다. 그 안에서 명령어를 대기하고 있는 것이다. 

Q. TV시청 중에 유사 명령어가 나와서 오작동이 일어날 가능성은 없나? 
A. 그래서 작동 키워드(Activation Keyword)를 만드는 것이다. ‘나래야’라고 했을 때 기계가 자신을 부르는 것을 인식하고 명령어를 대기하는 형태다. 이 명령어가 TV에서 나올 확률은 거의 없다고 생각한다.  

Q. 핀테크에서의 음성인식 기술 활용도는? 
A. (스마트폰을 꺼내 기자에게 보여주며) BC카드 ISP결제를 할 때 기존의 공인인증서, PIN번호 등을 입력했다면 여기보이는 ‘음성마이크’ 버튼을 누르면 본인 음성인식으로 이러한 인증수단을 대체할 수 있다. 이 기술이 확살될 수 있다는 의미다. 

Q. 오작동 날 가능성은 없는가? 
A. 그러한 확률은 굉장히 드물다. 파워보이스가 보장하는 확률이 0.05%다. 1만명 가운데 5명이란 의미다. 

Q. TV를 보면 개그맨 이용식씨가 탤런트 이덕화씨 부인에게 전화해 성대모사로 이덕화 흉내를 내 부인이 속았다는 일화도 있지 않나? 그런 부분에서 잘못 인식할 가능성은 전혀 없나? 
A. 인간의 귀가 기계가 인식하는 소리는 차이가 있다. 
음색이나 특징이 같은 것이 아니라 그 사람의 습관이나 말투에서 유사하다고 착각하게 된다. 
실제로 기계가 받아들이는 음성신호는 완전히 다르다. 

Q. 매출은 어느 정도 나오는가? 
A. 현재까지 매출이 많지 않다. 소프트웨어, 솔루션, 모듈 정도해서 지난해 50억원 나왔다. 순수제조업이 아니라 소프트웨어가 매출의 주라는 점에서 제조업과는 다른 시각에서 매출액을 바라볼 필요가 있다. 

Q. 음성인식 같은 경우에 국제표준이 없나? 예전 비디오 시장이나 통신시장의 경우 국제표준에 따라 기업의 흥망성쇠가 결정되기도 했지 않나? 
A. 국제 표준화 자체가 어렵다. 보이스xml 기반으로 개발을 하면 상용화시키는데 문제없다. 

Q. 올해 목표 매출은? 
A. 솔루션 매출 확대, 중국 매출 확대, 핀테크 도입으로 인한 화자인식 기술 수요 증가 등을 통해서 140억원 정도 예상하고 있다. 유럽업체와는 상당히 구체적으로 얘기가 진행되는 상황이다. 

Q. 일년만에 3배까지 성장할 수 있나? 
A. 지난해까지 소프트웨어 매출의 대부분이 솔루션, 시스템통합(SI)에서 발생했다. 모듈형태의 하드웨어 매출이 있었지만 미미했다. 올해는 음성인식 솔루션을 칩으로 개발했다. SoC(시스템온칩)이 조만간 출시된다. 칩 기반의 비즈니스를 확대할 계획이다. 산업분야는 핀테크와 같은 IoT분야가 활성화 되고 있어 매출원의 다양성을 기대하고 있다. 지난해보다는 다양한 분야, 보다 확대된 시장에서 비즈니스를 해나갈 계획이기에 충분히 가능하다고 보고 있다. 

Q. R&D로는 어느정도 투자하고 있나? 
A. 매년 25~30억원을 투자하고 있다. 전체 직원의 3분의 2가 R&D 인력이다. 

Q. 보유 특허건수는? 
A. 현재 보유중인 특허는 21건이다. 출원중인 것도 6건이다. 요즘에는 글로벌 특허 미국, 영국, 중국, 일본 등 주요 5개국 특허에 출원비만 5000만원가량 소요된다. 

Q. 영업이익률? 
A. 실제 영업이익률은 높지만 R&D비용 투하로 순이익률은 높지 않다. 다만 올해 개발비 회수과정에 들어와서 이익률이 크게 올라갈 전망이다. 
R&D를 제외하고 나면 40% 내외 수준에서 영업이익률이 나고 있는 실정이다. 100% 소프트웨어나 솔루션 매출이면 이익률이 조금더 올라가겠지만 하드웨어칩, 즉 임베디드 형태로 공급하는 매출부분이 더해져 순수이익률 측면에서 50%가 안되는 부분이 있다. 

Q. 2020년에 그리는 회사의 모습은? 
A. 기술 발전 수준이 워낙 빠르게 진행되고 있다. 솔직히 1~2년 뒤를 예상하는 것도 어렵다. 
향후 웨어러블, IoT 기술이 활성화 될 것으로 보고 있고 그 안에서 음성인식 기술은 핵심기술로 자리잡을 것으로 전망한다. 
파워보이스는 음성인식 기술을 선도하는 핵심기술, 원천기술을 보유한 회사로 자리매김할 것으로 기대한다. 

Q. 투자 하고 싶으면 어떻게 하면 되나? 
A. 회사로 직접 연락을 하면 좋겠다. 향후 2~3년내에 상장을 기대하고 있다. 
원천기술을 보유해 음성인식 기술 분야가 응용돼도 문제없이 생존했다. 
투자한다면 멀지 않은 시기에 충분한 보상을 받을 것이다. 
해외 매출확대에 따른 제조시설 확충 등 투자를 환영한다. 
관심을 가지고 연락(1544-0642) 해달라.

저작권자 © 타이쿤포스트 무단전재 및 재배포 금지