가까운 듯 먼 ‘음성 인식’ 서비스
가까운 듯 먼 ‘음성 인식’ 서비스
  • 이지혜 기자
  • 승인 2022.02.27 12:53
  • 댓글 0
이 기사를 공유합니다

KT-벤츠 차량 기술 탑재, 중소업체 ‘괄목 성과’
성능 향상, 보안‧프라이버시 문제…선결 과제

[한국뉴스투데이] “시리야” 아이폰 사용자라면 수도 없이 외쳐보았을 음성 인식 서비스다. 기업들은 여러 해 전부터 AI(인공지능)를 기반으로 한 음성 인식 서비스 제품을 시장에 내놓았다. 관련 시장이 커지는 것은 분명한데, 쓰임새가 떨어진다는 비판과 보안 및 프라이버시에 대한 우려가 여전하다.

음성 인식 기술과 서비스는 미래 먹거리 중 하나로 손꼽힌다. 그러나 사용자의 만족도는 시장의 성장세에 비해 다소 떨어지는 듯 보인다.(사진/픽사베이)
음성 인식 기술과 서비스는 미래 먹거리 중 하나로 손꼽힌다. 그러나 사용자의 만족도는 시장의 성장세에 비해 다소 떨어지는 듯 보인다.(사진/픽사베이)

◆스마트 스피커 판매량, 음성 검색량 전 세계 증가세 
구글의 자료를 보면 모바일 검색의 약 20%가 음성 검색으로, 그 수가 약 4억 회에 달한다. 주로 거실을 포함한 공유 공간(52%), 침실(25%), 주방(22%)에서 스마트 스피커를 두고 사용 중이라고 분석했다.

글로벌 시장조사 업체 카날리스는 전 세계 스마트 스피커 연간 판매량이 2018년 7,800만 대, 2019년 1억2,460만 대로 성장하고 있다고 발표한 바 있다.

우리나라에서도 음성 인식 서비스를 이용하는 수는 증가하고 있다.

과학기술정보통신부의 통계를 보면 2019년 3월 기준 우리나라 스마트 스피커 누적 판매량은 412만 대로 전년 대비 2배가량 늘었고, 2020년에는 누적 판매 1,000만 대를 넘어설 것으로 내다봤다.

이러한 성장의 기반은 국내 가전업체들의 적극적인 행보에 있다. 삼성전자, LG전자, SK텔레콤, KT, LG유플러스, 네이버, 카카오 등 IT 관련 대기업들이 음성 인식 AI 플랫폼을 출시했다.

대부분 한국어에 특화한 음성 인식 및 음성 합성 성능과 함께 통신사와 연계된 IPTV 셋톱박스 기능, 검색, 팟캐스트, 음악 스트리밍 등 국내 인터넷 및 모바일 서비스와의 연동을 강점으로 내세우고 있다.

◆KT 벤츠 차량 기술 탑재, 중소형 업체 ‘괄목 성과’
최근에도 우리나라의 음성 인식 기술은 성장을 거듭하는 모양새다.

KT는 최근 미국의 차량용 음성 인식 솔루션 업체 세렌스와 함께 메르세데스-벤츠 차량을 위한 AI 음성 인식 서비스를 출시했다.

S-클래스와 EQA 등 차종을 위한 이번 서비스는 주행 중 운전자가 필요로 하는 정보를 음성기반 시스템에 연결해 안전하고 직관적으로 제공한다.

위치정보 확인과 온라인 콘텐츠 검색부터 환율, 날짜 및 시간, 위키피디아, 단위변환, 소셜챗 등 서비스가 가능하다.

KT가 차량용 AI 서비스를 위해 손잡은 세렌스는 벤츠뿐 아니라 BMW, 아우디, 현대자동차 등 전 세계 2억 대 이상의 자동차에 음성 인식 기능을 제공하는 글로벌 기업이다.

또한, 국내 1호 AI 코스닥 상장 기업인 셀바스AI는 금융권과 스마트 선박업계에 진츨했다.

경찰 조서 작성과 병원 영상 판독 업무에서 높은 음성인식률이 검증됐고, 금융권의 투자상품 상담·판매와 스마트 선박의 음성 교신에까지 기술을 적용했다.

아울러 2018년 설립된 리턴제로는 ‘비토’라는 음성 인식 앱을 지난해 출시했는데, 통화 녹음 내용을 문자로 바꿔 채팅처럼 보여주는 서비스다.

지난해 말 기준 처리한 통화 수는 9,800만 건이 넘고, 중국 시장을 중심으로 글로벌 진출도 눈앞에 두고 있다.

◆성능 향상, 보안‧프라이버시 문제…선결 과제
관련 시장의 성장에도 불구하고 실제 효용성에 대한 우려가 여전한 상황이다.

업계에서는 음성 AI의 인식 정확도가 사람을 뛰어넘는 95% 이상이라고 자신하지만, 실제 음성 AI 단말과 서비스는 다소 복잡한 문장이나 문맥을 이해하지 못한다는 게 사용자들의 중론이다.

이는 한국어 음성의 복잡성과 음성 데이터 확보 시간의 부족 등에 의한 것으로 보인다. 그에 비해 구글 홈이나 아마존 알렉사와 같은 영어 기반의 플랫폼은 더욱더 많은 데이터를 확보해 여러 가지 경우의 수에서 최적의 답을 찾아내는 것에 근접해 있다.

음성 AI의 성능 향상과 별개로 보안 및 프라이버시 문제도 남아있다.

보통 가정의 거실과 방, 자동차 등에 놓인 스마트 스피커는 항시 실행을 대기하면서 사용자의 모든 음성 대화를 수집할 수 있다는 문제를 안고 있다.

실제 2019년 4월에는 아마존이 스마트 스피커로 사용자의 음성 명령을 녹음해왔다는 사실이 드러나 논란이 되기도 했다.

애플 시리와 구글 어시스턴트 또한 이러한 음성 명령 녹음 논란에서 자유롭지 못하다. 딥러닝 방식으로 기존의 음성 명령을 학습해야 하므로 어쩔 수 없다고는 하지만, 개인 정보와 프라이버시가 노출될 위험이 존재하는 것은 무시할 수 없다.

국내에서는 보이스피싱 업체가 사용자의 음성을 녹음해 보이스 결제에 도용하거나, 가족을 속이는 범죄에 악용하는 사례도 나온 바 있다.

이지혜 기자 2jh0626@naver.com

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.