요약문
스마트폰 이후 다양한 스마트 기기의 등장으로 오디오 중요성이 커졌다. 커넥티드카, FAST, 스마트 글라스 등은 오디오를 중심으로 사용자 경험을 혁신하고 있다. BMW·현대차는 음성 AI로 차량 기능을 제어하고, 삼성전자는 하만 인수로 오디오 경쟁력을 강화했다. 메타·애플·삼성은 AI 기반 스마트 글라스를 선보이며 오디오 중심 생태계를 확대 중이다. 또한 온디바이스 AI 기술 발전으로 기기 내 음성인식과 실시간 번역이 가능해지며 보안성과 속도도 개선됐다. 오디오는 스마트 기기의 핵심 경험으로 진화하고 있다.
1. 들어가며
2000년대 후반 스마트폰이 등장한 후 지난 15년간 다양한 스마트 기기가 우리 삶에 들어왔다. 자동차 역시 인터넷과 접목되면서 거대한 스마트 기기가 됐으며, 안경마저 스마트 글라스로 변모하며 다양한 기능을 제공하고 있다.
이 같은 다양한 스마트 기기의 등장과 함께 오디오의 중요성도 커지고 그 역할도 변화했다. 특히 인공지능(AI)이 등장하면서 오디오는 기기를 제어하는 주요 이용자 환경(UI)이 됐으며, 음성인식을 활용한 비서, 번역 등 새로운 기능을 통해 이용자 경험(UX)도 향상했다.
새롭게 등장한 기기마다 어떻게 오디오를 접목하고 있으며, 어떤 방향으로 오디오 경험이 진화하게 될지 주요 사례 등을 통해 살펴보고자 한다.
2. 신규 디바이스와 오디오 접목
2-1. 커넥티드카
커넥티드카는 차량이 네트워크와 실시간으로 소통하며 운전자의 편의와 교통안전을 돕고 인터넷의 다양한 서비스를 제공하는 것을 의미한다. 최초 커넥티드카는 1996년 제너럴 모터스에서 만든 ‘온스타(On Star)’ 서비스로, 셀룰러와 위성통신 기반으로 내비게이션, 차량 추적, 긴급 구조 요청 전화 등의 서비스를 제공했다.

특히 2010년대 후반부터 무선랜(와이파이), 5G 이동통신 등 통신 수단이 급격히 발달, 확산하면서 커넥티드카는 보편화됐다. 실시간 길 안내, 차량 점검 서비스 등 커넥티드카의 여러 서비스 가운데 운전자가 가장 많이 사용하는 것이 오디오 서비스다.
오디오는 커넥티드카에 최적의 사용자 환경(UX)을 제공한다. 운전자가 안전하게 차량을 운전하기 위해서는 불필요한 움직임을 최소화해야 한다. ‘터치’ 대신 음성과 오디오를 활용한 검색, 명령 등이 안전하고 자연스럽게 활용되면서 오디오를 통해 차량 내 다양한 활동이 가능한 환경이 구현됐다.
2-2. FAST
광고 플랫폼 시장에도 오디오 플랫폼이 주요 채널로 부상하고 있다. FAST(Free Advertising Streaming TV)는 광고 기반 무료 스트리밍 서비스를 뜻한다. 광고를 보는 대신 무료로 TV를 시청할 수 있는 방식으로 세계적으로 인기다.
TV에 머물렀던 FAST 시장이 최근 오디오까지 확장하는 추세다. 오디오 스트리밍 서비스 ‘팟캐스트‘ 등에서 광고를 듣는 대신 오디오 콘텐츠를 무료로 청취하는 방식이다. 음성 광고가 영상 광고보다 더 쉽게 수용된다는 측면에서 FAST 플랫폼 내에서 오디오 플랫폼이 더 돋보일 수 있다는 분석도 제기된다.
2-3. 스마트 글라스
스마트 글라스 기술이 발달하면서 오디오 역시 스마트 글라스의 주요 기능 중 하나로 자리 잡고 있다.
스마트 글라스에서 오디오는 여러 방법으로 구현된다. 기업들이 주로 많이 사용하는 것은 스마트 글라스 프레임 다리 끝에 스피커를 내장해 귀를 막지 않고 귀 근처로 소리를 내보내는 방식이다. 스마트 글라스 프레임의 코 받침이나 귀 뒤쪽에 두개골을 진동시켜 음파를 청각 신경에 전달하는 방법도 있다.

스마트 글라스와 오디오는 다양한 결합으로 활용된다. 음성인식을 통해 스마트 글라스 기능을 조절하는 것 외에도 실시간 통번역이나 위치 기반 다양한 정보, 사용자 주요 일정 등도 오디오로 전달해 준다. 이처럼 스마트 글라스가 실질적 역할을 할 수 있도록 도와준다는 측면에서 스마트 글라스에서 오디오의 중요성은 더 커질 것으로 보인다.
3. 빅테크 기업 활용 사례
빅테크 기업들이 오디오 서비스를 가장 활발하게 접목하는 분야는 커넥티드카다. 자동차 제조사들은 음성 AI를 활용한 차별화된 서비스 제공에 주력하고 있다.

가장 최근 주목받은 사례는 BMW와 글로벌 1위 클라우드 기업 아마존웹서비스(AWS)의 협력이다. 아마존은 11월 7일, ’알렉사 커스텀 어시스턴트(Alexa Custom Assistant)‘ 플랫폼을 발표하고, 이를 BMW 차량에 우선 적용한다고 밝혔다. 이를 통해 운전자는 차량 매뉴얼을 음성으로 조회하거나, 목적지 설정·조명·온도 제어 등 기능을 수행할 수 있게 된다. 무엇보다 AWS의 생성형 AI 기술을 활용, 질문하듯 자연스럽게 물어볼 수 있다는 점이 이전 서비스들과 차별점이자 강점이다.
현대자동차그룹도 2021년부터 자연어 기반으로 차량 내 다양한 기능과 시스템을 편리하게 제어하고 사용할 수 있는 AI 음성인식 기술을 개발해 적용 중이다.
최근에는 ‘챗GPT’ 기반 AI 어시스턴트를 개발, 음성으로 다양한 질문과 명령을 할 수 있도록 구현했다. 일각에서는 최근 현대자동차그룹이 엔비디아와 협력 계획을 발표하면서 향후 진일보한 AI 기능이 담길 것으로 전망한다.

전장 업체 가운데에선 삼성전자가 가장 적극적이다. 삼성전자는 지난 2016년 미국 오디오 전문기업 하만을 80억 달러에 인수하며 본격적으로 이 시장에 뛰어들었다. 여기에 더해 올해 7월 미국 마시모의 오디오 사업부를 3억 5,000만 달러에 인수하며 오디오 분야에 지속 투자하는 중이다. 마시모의 오디오 사업부 인수가 모바일·TV 등의 차별화된 음향·오디오 기술 경쟁력 제고에도 일조할 것으로 기대했다. 마시모 오디오 사업부 주요 브랜드가 축적한 전문적 오디오 기술·노하우를 삼성전자의 스마트폰, 무선이어폰, 헤드폰, TV, 사운드바 등에 적용할 예정이다. 이를 통해 프리미엄 오디오 경험을 제공, 가전을 비롯해 자동차 분야 등 글로벌 오디오 시장에서 입지를 굳힌다는 전략을 펼친다.

스마트 글라스의 경우 메타가 발 빠르게 움직이고 있다. 메타는 글로벌 안경 전문업체 레이밴(Ray-Ban)과 협력해 레이밴 스마트 글라스에 반투명 디스플레이를 탑재한 신제품을 지난 10월 공개하며 주목받았다. 반투명 디스플레이를 통해 메시지 확인을 비롯해 내비게이션 등 증강현실(AR) 기능을 경험할 수 있다. 여기에 더해 이미 올해 상반기엔 AI 기능을 탑재, 음성 명령만으로 사진을 촬영하고 공유하거나 음악도 재생하는 진일보한 모습을 보여줬다. 특히 오디오 중심의 스마트 글라스는 더 늘어날 것으로 예상된다. 애플과 삼성전자 역시 오디오와 AI가 중심이 된 스마트 글라스를 조만간 각각 선보인다고 발표한 상황이라 내년에는 스마트 글라스의 오디오 경쟁이 더 치열해질 것으로 보인다.
4. 온디바이스 음성 기술 적용 사례
4-1. 온디바이스 AI란
온디바이스 AI란 클라우드에 의존하지 않고 모바일 기기 자체에서 AI 기능을 직접 수행하는 것을 의미한다. 지금까지 AI는 주로 클라우드 기반에서 사용됐다. 이를 위해 모바일의 데이터 등을 클라우드로 전송해야 하는데 이 과정에서 지연 시간이 발생한다는 단점이 있다. 개인 정보가 외부 서버로 전송되기 때문에 보안 우려도 있었다.

온디바이스 AI의 경우 데이터 등을 외부 서버로 보내지 않고 해당 기기에서 작동하기 때문에 시간 지연이 거의 없다. 인터넷 연결 없이 AI 기능이 바로 작동하기 때문에 보안 문제도 줄어든다는 점이 특징이다.
온디바이스 AI 초기에는 사진과 영상 품질 향상, 간편한 편집 기능 등에 초점을 맞췄다. 그러나 하드웨어 기능이 빠른 속도로 좋아지면서 이를 넘어선 다양한 영역에서 AI 기능을 구현할 수 있게 됐다. 특히 실시간 번역 내용을 사용자의 목소리로 전달하는 것도 가능해져 음성인식 분야에서도 온디바이스 AI가 활발하게 사용된다. 번역이 필요한 문장이나 상황이 발생해도, 예전처럼 인터넷 연결이 되지 않는 상황에서도 실시간 번역 도움을 받을 수 있다는 점은 이전 대비 획기적 변화다.
4-2. 온디바이스 AI 음성인식 적용 사례: AI 비서
온디바이스 AI를 활용한 대표적 사례로 ‘음성인식 AI 비서’를 꼽을 수 있다. 국내외 주요 회사마다 음성인식 AI 비서 서비스를 선보이며 시장 선점에 나서고 있다.
삼성전자는 자사 스마트폰과 스마트 가전 등에 온디바이스 AI를 통해 음성인식 AI 비서를 구현 중이다. 최신 스마트폰인 갤럭시 시리즈에는 온디바이스 AI 기반 음성인식 AI 비서 ‘빅스비’가 탑재됐다. 인터넷이 연결되지 않는 오프라인 상태에서도 원하는 작업과 명령을 지시할 수 있다.
LG전자는 지난해 ‘온디바이스 AI 사업화 태스크’ 조직을 신설, AI 음성인식 비서 기술 개발에 주력하고 있다. ‘빅스비’를 견제하는 동시에 AI 가전 분야에서 우위를 차지하기 위한 행보를 보인다.

구글은 이들 가전 제품의 기반이 되는 AI 모델을 대거 강화 중이다. 지난 9월 발표한 ‘젬마 3n’은 가장 최신 온디바이스 AI 모델로 음성 명령을 통해 AI 비서 구현에 유용하다. 특히 음성인식의 경우 단순히 받아 적는 수준을 넘어 텍스트로 자동 전환 등 AI 비서의 중요한 역할을 수행한다. 구글은 이 모델을 깃허브에 오픈소스로 공개했다. 국내외 여러 중소기업에서도 이 소스코드를 활용해 다양한 온디바이스 기반 AI 비서를 개발할 수 있어 생태계 확장에도 많은 도움을 줄 것으로 기대된다.
4-3. 온디바이스 AI 음성인식 적용 사례: 번역
온디바이스 AI 기반 실시간 음성 번역 기술도 국내외 다양한 기업에서 발표하며 확산 중이다.

‘챗GPT’ 혁명으로 AI가 본격 등장했던 2024년부터 스마트폰 제조사를 중심으로 음성인식 번역 기술이 공개되기 시작했다. 2024년 1월, 삼성전자는 신규 스마트폰 갤럭시 S24 시리즈를 공개하며 온디바이스 AI 기반 음성번역 기능을 처음 선보였다. 별도 앱을 설치하지 않아도 서로 다른 언어로 소통하는 사람과 전화 통화 시 실시간 통역 서비스를 제공받을 수 있다는 점에 당시 세계가 주목했다. 온디바이스 AI 기반으로 통역이 이뤄지기 때문에 통화 내용이 외부로 유출될 가능성도 적어 사용자가 안심하고 사용할 수 있다는 점도 온디바이스 AI 강점을 살린 대표 사례다.
전문 기술력을 보유한 중소기업도 언어 장벽을 허무는 기술을 속속 선보였다.

코난테크놀로지는 지난해 6월 실시간 음성번역이 가능한 온디바이스 AI 기술 ‘코난 온디바이스’를 공개했다. 스마트폰의 마이크 버튼을 탭 해 한국어로 말하면 자동으로 음성이 인식되고, 실시간 번역 후 상대방에게 영어 음성으로 제공된다. 사용자가 말한 내용을 번역해 상대방 언어의 음성으로 들려주고, 사용자의 언어와 상대방의 언어 번역 결과가 스마트폰 화면에 대화 창으로 표시되는 방식이다. 코난테크놀로지는 스마트폰뿐 아니라 내비게이션, 차량 등 다양한 제조사와 협업을 통해 음성번역 기능을 제공한다는 계획이다.
번역 기술 전문업체인 플리토도 온디바이스 AI 방식의 음성번역 서비스를 지원하기 위해 AI 반도체 팹리스 기업 퓨리오사 AI와 지난 7월 업무협약을 체결한 바 있다. 이를 통해 플리토는 네트워크 연결 없이도 AI 기반 실시간 음성 통역 서비스를 제공하려 한다.
5. 마치며
차량과 다양한 웨어러블 기기가 ‘오디오 중심 경험(Audio-first experience)’의 핵심 플랫폼으로 부상하고 있다는 것을 확인했다. 국내외 빅테크 모두 이 분야에 투자를 강화하는 만큼 관련 서비스나 기술은 지속해서 나올 것으로 예상된다.
이 같은 상황 속에서 해결해야 할 이슈도 많다. 우선 음성의 경우 보안에 주의해야 한다. 스마트차량과 스마트 글라스의 경우 사적인 대화 등 음성 데이터와 프라이버시를 보호하는 기술적 장치가 필요하다. 이를 위해 음성 데이터 전송 혹은 공유 시 이를 암호화하거나 해킹 등의 피해를 입지 않도록 보안을 강화하는 조치가 동반돼야 한다.
오디오의 기술도 지속 발전돼야 한다. 스마트차량, 스마트 글라스 등 대부분 스마트 기기가 열린 공간에 존재한다. 잡음이나 여타 소음으로부터 정확하게 음성을 인식하고 명령을 수행하기 위해선 음향 기술이 중요하다. 삼성전자가 최근 음향 전문 회사를 인수한 것도 음향 품질의 중요성을 인식하기 때문이다.
음성인식의 경우 여전히 정확도와 속도 측면에서 개선이 필요하다. 특히 실시간 통역의 경우 정확하게 음성을 인식해야 통역 품질도 높아진다.
이 밖에도 플랫폼과 생태계 확보도 중요하다. 단일 기기만으로는 충분치 않고, 콘텐츠·서비스·하드웨어가 함께 연결돼야 하며 이를 위해 콘텐츠 제공자와 플랫폼 기업 간 협업도 지속돼야 할 것으로 보인다.

