Siri, Google 어시스턴트 및 Cortana – 3가지 디지털 어시스턴트 비교

90년대에 음성 받아쓰기 소프트웨어(voice dictation software) 를 사용해 본 것을 기억할 만큼 나이 가 들었다면 지루함의 진정한 의미를 알 것입니다. 음성을 사용하여 이메일이나 메모를 입력하려면 몇 시간의 훈련이 필요했고 고통스러울 정도로 느린 말하기 속도와 궁극적으로 꽤 쓸모없는 텍스트 조각이 필요했습니다.

오늘날 상황은 이보다 더 다를 수 없습니다. 기계 학습 및 클라우드(machine learning and cloud) 컴퓨팅 성능 의 주요 발전 덕분에 디지털 음성 인식(voice recognition) 시스템은 다른 사람과 마찬가지로 귀하를 이해할 수 있습니다.

그렇기 때문에 모든 스마트폰, 노트북 및 태블릿(laptop and tablet) 에 내장형 디지털 어시스턴트(Digital Assistant) 를 탑재할 수 있습니다. 세 가지 주요 플레이어는 Apple (Apple)Siri , MicrosoftCortana 및 Google의 Google Assistant(Google Assistant) 입니다 . 이름에서 명확하지 않은 경우.

세 명의 조수 모두 비슷한 업무를 수행하며 고유한 가치 제안을 제공합니다. 어떤 어시스턴트가 "최고"인지 객관적으로 말하기는 불가능하지만 특정 공통 작업과 함께 비교하는 것은 유용한 연습입니다. 이 글을 읽는 모든 사람에게 이 조수 중 한 명이 귀하의 특정 상황에 가장 잘 맞는 사람입니다. 

따라서 이 3방향 비교의 목표는 각 옵션의 약점과 강점을 보여 주어 누구와 함께 갈 것인지에 대해 정보에 입각한 선택을 할 수 있도록 하는 것입니다. 그러나 그 전에 세 명의 멋진 참가자를 소개하겠습니다.

Siri – 진정한 원본(Siri –  A True Original)

Siri 는 (Siri)iPhone 4S 의 독점 기능으로 처음 출시되었습니다 . iPhone 11(iPhone 11) 이 2019년에 출시되므로 Siri(Siri one) 는 오늘날 가장 오래된 디지털 비서 중 하나가 되었습니다. 

Siri 의 첫 번째 티저가 방영되었을 때 , 그것은 약간 공상 과학 소설(science fiction) 처럼 보입니다 . 놀라운 음성 합성(voice synthesis) 과 겉보기에 흠잡을 데 없는 음성 인식(voice recognition) 은 진정한 쇼스토퍼였습니다. 돌이켜보면 Siri 는 연기, 거울, 상대적으로 제한된 고품질 기능 영역을 어느 정도 포함했습니다. 그 이후로 그녀는 지능과 기능(intelligence and features) 으로 덩치를 키웠지만 대중적인 의견은 그 늙은 소녀가 더 이상 기술 리더(technology leader) 가 아니라는 것 입니다. 

그럼에도 불구하고 이 어시스턴트는 Apple 에코시스템 으로 제한되므로 (Apple ecosystem)Apple 애호가 가 기기와 함께 제공되는 (Apple aficionados)매장 브랜드 어시스턴트(store-brand assistant) 를 고수해야 하는지 여부가 더 큰 문제입니다 . 

Cortana – 게임 여신에서 개인 비서로(Cortana – From Game Goddess To Personal Assistant)

Cortana 는 Bungie의 세계적으로 유명한 (Cortana)Halo 시리즈(Halo series) 게임 의 캐릭터 이름을 따서 명명되었습니다 . 그녀 는 게임 시리즈(game series) 의 영웅인 마스터 치프(Master Chief) 를 보조하는 AI입니다 . 이제 당신도 그녀의 상징적인 목소리(voice talk) 를 머릿속에서 말할 수 있습니다. 글쎄, 그것은 풀 사이즈 Halo Master Chief 수집가(Halo Master Chief collector) 의 헬멧 과 함께 헤드폰을 착용하는 경우입니다 .

Microsoft의 모바일 운영 체제(operating system) 는 사실상 더 이상 존재하지 않기 때문에 Cortana 는 주로 Windows 10 기능이며 Android 및 iOS 스토어(Android and iOS stores) 모두에 앱이 있습니다 . 이것은 그녀가 몇 가지 훌륭한 Windows 통합(Windows integration) 기능을 제공한다는 것을 의미하지만, 물론 사람들이 실제로 사용하는 모바일 시스템의 고유 기능은 아닙니다.

Google 어시스턴트 – 튜링 테스트 시작(Google Assistant – Taking On The Turing Test)

Google 은 의심할 여지 없이 세계 최고의 기술 회사 중 하나입니다. 특히 고급 AI 알고리즘(AI algorithms) 의 경우 . 따라서 Google 어시스턴트(Google Assistant) 가 최신 기술로 가득 차 있다는 것은 놀라운 일이 아닙니다. 

어떤 면에서 이것은 약간의 문제가 될 수 있습니다. 기능 세트는 지속적으로 변화하고 있으며 Google 어시스턴트(Google Assistant) 가 어디에서 끝나고 다른 Google 서비스가 시작되는지 항상 명확하지 않습니다.

예를 들어, Google Duplex 는 Google의 (Google Duplex)AI 챗봇(AI chatbot) 이 (예를 들어) 지역 미용사에게 전화를 걸어 약속을 잡아 주는 매우 인상적인 서비스 입니다. 물어보기만 하면 됩니다. 그러나 Duplex 는 자체 프로젝트로 개발된 다음 확장 기능으로 Assistant 에 포함되었습니다.(Assistant)

Google 어시스턴트(Google Assistant) 사용 의 장점은 Android 와의 뛰어난 통합을 포함 하여 Google 서비스 와 긴밀하게 통합된다는 것 입니다.

테스트 방법(How We Tested)

이 비교의 이면에 있는 아이디어는 이 세 가지 보조자를 종이 사양에 따라 비교하는 것이 아닙니다. 대신 실제로 일상적으로 사용하는 방법에 대해 직접 비교하는 것이 좋습니다.

여기서 중요한 것은 사용자 경험과 이러한 뛰어난 봇이 실제로 원하는 작업을 수행하는지 여부입니다. 특정 어시스턴트(specific assistant) 가 특정 사용 사례 에 대한 (use case)킬러 기능(killer feature) 을 가지고 있다면 이것은 어쨌든 무의미합니다.

여기서 문제의 디지털 비서 3개를 테스트하기 위해 2개의 개별 장치를 사용했습니다. Siri 의 경우 작성 당시 최신 버전의 iOS 12가 설치된 iPad Pro 9.7 ” 태블릿 을 사용했습니다. (” tablet)다른 두 장치에는 Samsung Galaxy Note 10+ 를 사용했습니다 .

아이디어는 일상적인 사용에 대한 느낌을 얻는 것이므로 인터넷 검색 수행, (internet search)캘린더 알림(calendar reminder) 생성 및 응용 프로그램 시작을 포함하여 각각의 공통 작업이 정확히 동일하게 주어졌습니다.

음성 합성 품질(Voice Synthesis Quality)

어려운 기술 사양은 아닐지 모르지만 디지털 비서는 말할 때 얼마나 자연스럽게 들리느냐에 따라 살고 죽습니다. 이러한 응용 프로그램의 요점은 사용자를 대화형 인터페이스로 전환하는 것입니다. 즉, 거슬리는(Which) 로봇 음성(voice isn) 은 허용되지 않으며 대부분의 사람들이 그러한 제품을 사용하는 것을 꺼릴 것입니다.

이 세 가지 테스트에서 Google 어시스턴트(Google Assistant) 가 2위를 차지했으며 2 위는 Siri 이고 3위는 (Siri)Cortana 입니다. Google과 Apple의 제품 모두 최소한 북미 영어 버전에서는 자연스럽게 들리지만 (English)Cortana 가 좋지 않아 업그레이드가 필요한 것처럼 들립니다.

트리거 프레이즈 리액션 퍼포먼스(Trigger Phrase Reaction Performance)

최신 디지털 비서(digital assistant) 의 가장 큰 특징 중 하나 는 핸즈프리 사용입니다. 당신이 해야 할 일은 마법의 단어를 말하는 것뿐입니다. 그러면 조수가 도와줄 준비가 되어 있습니다. 적어도 이론상으로는. 그래서 우리는 방아쇠 단어(trigger word) 가 얼마나 잘 반응  했는지 확인하고 싶었습니다 .

(Please note)iOS의 경우 Siri 만 핸즈프리 트리거링을 지원합니다 . iOS에 Cortana와 Google 어시스턴트(Cortana and Google Assistant) 를 모두 설치할 수 있지만 한 마디로 실행할 수는 없습니다. 여기서 가장 간단한 해결 방법은 Siri 에게 다른 어시스턴트를 실행하도록 요청하는 것입니다. 이상하지만 절대적으로 필요한 경우 몇 초의 추가 작업이 추가됩니다.

Apple의 Siri 부터 시작하겠습니다 . "Hey Siri " 트리거 구문(trigger phrase) 을 사용하는 것은 즉각적이며 질문을 하기 전에 프롬프트를 기다릴 필요가 없습니다. Google 어시스턴트(Google Assistant) 도 마찬가지로 잘 수행되지만 기본적으로 이 방식으로 작동하지 않습니다. 적어도 Google 이외의 휴대전화에서는 그렇지 않습니다. 잠긴 경우에도 휴대 전화의 어느 곳에서나 디지털 지니를 소환할 수 있는 "Voice Match" 설정을 찾기 위해 메뉴를 꽤 많이 파고들었습니다.

Cortana의 앱 은 앱이 열려 있을 때만 트리거 (only )단어(trigger word) 에 응답합니다 . 그래서 정직하게 유용하지 않습니다.

지루하지만 유용한 것들(The Boring But Useful Stuff)

미리 알림 설정, 웹 페이지 열기, 앱 시작 및 기타 유사한 작업은 디지털 비서 사용의 기본입니다 . (bread and butter)그렇다면 이 세 가지는 어떻게 될까요?

웹 검색을 할 때 세 가지 조수 모두 완벽합니다. CortanaBing 을 사용하는데 , 이는 Google의 알고리즘을 선호하는 사람들에게는 좋지 않을 수 있습니다. 세 사람 모두 기쁜 마음으로 미리 알림을 설정하고, 메모를 작성하고, 달력에 약속을 기록했습니다.

iOS 에서 Siri 는 침착하게 앱을 실행 (Siri)하고 Apple Music 서비스(the Apple Music service) 를 사용하여 기꺼이 음악을 재생 합니다 . Android 에서 Google 어시스턴트(Google Assistant) 는 앱 실행 요청에도 기꺼이 따르지만 이상하게도 YouTube Music 에서는 제대로 작동하지 않습니다 . 곧 수정될 예정입니다. Cortana 는 앱 실행을 완전히 거부 하거나(apps or step) 앱 버블 전체에서 벗어나려고 합니다.

그것이 Cortana 가 우리를 위해 할 수 있는 전부입니다. 전혀 많지 않습니다 .(Which)

장치 통합 및 제어(Device Integration & Control)

디지털(Digital) 비서는 올바른 권한에 액세스할 수 있는 경우 장치를 핸즈프리로 작동하는 데 적합합니다. 최신 버전의 Siri 는 그녀가 있는 (Siri)Apple 장치(Apple device) 를 거의 완벽하게 제어 합니다. 그녀는 WiFi 또는 Bluetooth(WiFi or Bluetooth) 를 켜거나 끄는 것과 같은 많은 토글을 관리할 수 있습니다 . Siri 를 사용하여 VoiceOver 와 같은 손쉬운 사용 기능을 활성화할 수도 있습니다 .

Android 에서는 Google 어시스턴트(Google Assistant) 가 비트를 건너뛰지 않고 일반 설정을 토글했습니다 . 그러나 Cortana(Cortana) 는 관리할 수 없었으며, 이는 현시점에서 그리 놀라운 일이 아닙니다.

비언어적 사용(Nonverbal Use)

이러한 장치 의 가장 큰 특징(showcase feature) 은 단순히 대화를 통해 작업을 완료할 수 있다는 사실이지만 디지털 비서와 큰 소리로 대화하는 것이 항상 가능하거나 바람직한 것은 아닙니다. 버스에 있거나 회의 중이거나 조용히 있고 싶은 다른 장소에 있을 수 있습니다. 

요즘에는 대부분의 비서가 문자 채팅 모드(text chat mode) 를 사용하여 대화를 중단하면서도 자연어 응답을 받을 수 있습니다.

그러나 Siri는 기본적으로 이 작업을 수행하지 않습니다. iOS 접근성 메뉴 로 이동 (accessibility menu and activate) 하여 Siri에게 입력을(Type to Siri) 활성화해야 합니다. Cortana와 Google Assistant(Cortana and Google Assistant) 모두 기본적 으로 텍스트 입력(text input) 을 사용할 수 있으므로 여기에서 약간의 추가 크레딧을 얻습니다.

음성 인식 성능(Voice Recognition Performance)

디지털 비서는 당신을 얼마나 잘 이해할(assistant understand) 수 있습니까? 이 질문에는 두 부분이 있습니다. 첫 번째는 연설을 텍스트로 정확하게 변환하는 것과 관련이 있습니다. 당신이 말하는 내용이 자동 고침처럼 뒤죽박죽으로 바뀌면 별로 소용이 없습니다. 질문의 두 번째 부분은 귀하가 말한 내용이 소프트웨어에서 얼마나 잘 구문 분석되는지와 관련이 있습니다. 

세 명의 어시스턴트 모두 문제 없이 우리가 말한 내용을 이해하고 올바르게 구문 분석했습니다. 여기에 보고할 내용은 많지 않지만 2019년의 음성 인식 및 AI(voice recognition and AI) 는 꽤 인상적입니다.

평결 - 누가 정상에 올랐습니까?(The Verdict –  Who Came Out on Top?)

Apple 사용자의 경우 판결은 명확합니다. Siri 는 (Siri)최첨단 기술(cutting-edge technology) 측면에서 객관적으로 Google Assistant 에 뒤떨어져 있지만 iOS 및 Apple하드웨어(s hardware) 와의 긴밀한 통합 은 최고의 전반적인 경험을 제공한다는 것을 의미합니다.

특히 거의 완벽한 핸즈프리 성능을 감안할 때. Apple Music 과 같은 Apple 서비스 도 사용 하고 Siri 단축키를 미세 조정하는 데 시간을 할애 한다면 iOS 기기에서 다른 디지털 비서가 가하는 한계를 견디는 것을 상상하기 어렵습니다.

어쨌든 Siri(Siri) 에 액세스할 수 없는 Android 사용자의 경우 상황 (Android) 더 흥미로워집니다. Galaxy Note 10+테스트 장치(test device)Cortana와 Google Assistant 사이(Between Cortana and Google Assistant) 에서 Google Assistant 가 분명히 우위를 점하고 있습니다. Cortana가 Bing검색 엔진(search engine) 으로 사용하는 것은 이해할 수 있지만 Bing 은 일관되게 덜 만족스러운 검색 결과를 제공했으며 이는 그에 대해 다소 심각한 표시입니다. 

그러나 결국 Cortana 는 (Cortana)Android 에서 매우 제한된 애플리케이션입니다 . Windows 에서 (Windows)Cortana 와 함께 존재하는 교차 기능으로 인해 유용한 추가 앱이 될 수 있지만 Google Assistant 가 바로 거기에 있고 제대로 통합되어 있는 경우 기본 Android 도우미 로 권장할 수 없습니다.(Android assistant)



About the author

저는 10년 이상의 IOS 및 MacOS 시스템 작업 경험을 가진 하드웨어 엔지니어입니다. 나는 또한 지난 5년 동안 야간 수업 교사로 일했으며 스스로 Chrome 사용법을 가르쳤습니다. 두 영역 모두에 대한 나의 기술은 웹사이트 개발, 그래픽 디자인 또는 웹 보안 작업에 대한 완벽한 후보자입니다.



Related posts