구글이 70여 가지 언어를 실시간 통역할 수 있는 번역 모델을 내놨다.
구글은 최신 인공지능(AI) 모델을 기반으로 한 번역 모델 '제미나이3.5 라이브 트랜슬레이트'를 구글 번역 앱에 전면 도입한다고 9일 밝혔다.
구글은 새 번역 모델이 순차 통역 방식에서 동시통역에 가까운 '연속 실시간 생성' 방식으로 바뀌었다고 소개했다.
음성을 즉시 번역하는 것과 품질을 높이고 문맥을 파악하기 위해 기다리는 것 사이의 균형을 모델이 적절히 맞추면서 통역한다는 것이다.
이에 따라 통역 음성은 원래 화자의 말과 견준 시차가 단 몇 초에 불과하다.
또 이전에는 이용자가 어떤 언어를 번역할지 미리 선택해야 했으나, 새 모델은 자동으로 언어를 감지해서 번역한다. 여러 언어가 뒤섞이는 다국어 대화 환경에서도 사용할 수 있다.
음성 생성 자체의 기술력도 높여 원래 화자의 억양이나 말투, 음높이 등도 그대로 살려 자연스러운 음성으로 전달한다.
기존에는 아이폰·안드로이드폰의 구글 번역 앱에서 음성 통역을 이용하려면 반드시 이어폰을 연결해야 했지만, 이제는 이어폰 없이도 마치 통화하듯이 스마트폰을 귀에 대면 번역된 음성을 들을 수 있다.
구글은 자사 화상회의 플랫폼인 '구글 미트'에도 이 기능을 적용해 다국어 회의 등을 지원할 방침이다.
이 모델을 미리 사용해본 그랩과 아고라 등 주요 서비스 기업도 기능을 호평했다.
초기 테스트에 참여한 CJ ENM의 백현정 최고AI책임자(CAIO)도 "전 세계와 한국 시청자들에게 더욱 생생한 경험을 선사할 수 있을 만큼 뛰어난 품질을 보여준다"고 평가했다.
<연합뉴스>