90년대에 음성 받아쓰기 소프트웨어(voice dictation software) 를 사용해 본 것을 기억할 만큼 나이 가 들었다면 지루함의 진정한 의미를 알 것입니다. 음성을 사용하여 이메일이나 메모를 입력하려면 몇 시간의 훈련이 필요했고 고통스러울 정도로 느린 말하기 속도와 궁극적으로 꽤 쓸모없는 텍스트 조각이 필요했습니다.
오늘날 상황은 이보다 더 다를 수 없습니다. 기계 학습 및 클라우드(machine learning and cloud) 컴퓨팅 성능 의 주요 발전 덕분에 디지털 음성 인식(voice recognition) 시스템은 다른 사람과 마찬가지로 귀하를 이해할 수 있습니다.
그렇기 때문에 모든 스마트폰, 노트북 및 태블릿(laptop and tablet) 에 내장형 디지털 어시스턴트(Digital Assistant) 를 탑재할 수 있습니다. 세 가지 주요 플레이어는 Apple 의 (Apple)Siri , Microsoft 의 Cortana 및 Google의 Google Assistant(Google Assistant) 입니다 . 이름에서 명확하지 않은 경우.
세 명의 조수 모두 비슷한 업무를 수행하며 고유한 가치 제안을 제공합니다. 어떤 어시스턴트가 "최고"인지 객관적으로 말하기는 불가능하지만 특정 공통 작업과 함께 비교하는 것은 유용한 연습입니다. 이 글을 읽는 모든 사람에게 이 조수 중 한 명이 귀하의 특정 상황에 가장 잘 맞는 사람입니다.
따라서 이 3방향 비교의 목표는 각 옵션의 약점과 강점을 보여 주어 누구와 함께 갈 것인지에 대해 정보에 입각한 선택을 할 수 있도록 하는 것입니다. 그러나 그 전에 세 명의 멋진 참가자를 소개하겠습니다.
Siri – 진정한 원본(Siri – A True Original)
Siri 는 (Siri)iPhone 4S 의 독점 기능으로 처음 출시되었습니다 . iPhone 11(iPhone 11) 이 2019년에 출시되므로 Siri(Siri one) 는 오늘날 가장 오래된 디지털 비서 중 하나가 되었습니다.
Siri 의 첫 번째 티저가 방영되었을 때 , 그것은 약간 공상 과학 소설(science fiction) 처럼 보입니다 . 놀라운 음성 합성(voice synthesis) 과 겉보기에 흠잡을 데 없는 음성 인식(voice recognition) 은 진정한 쇼스토퍼였습니다. 돌이켜보면 Siri 는 연기, 거울, 상대적으로 제한된 고품질 기능 영역을 어느 정도 포함했습니다. 그 이후로 그녀는 지능과 기능(intelligence and features) 으로 덩치를 키웠지만 대중적인 의견은 그 늙은 소녀가 더 이상 기술 리더(technology leader) 가 아니라는 것 입니다.
그럼에도 불구하고 이 어시스턴트는 Apple 에코시스템 으로 제한되므로 (Apple ecosystem)Apple 애호가 가 기기와 함께 제공되는 (Apple aficionados)매장 브랜드 어시스턴트(store-brand assistant) 를 고수해야 하는지 여부가 더 큰 문제입니다 .
Cortana – 게임 여신에서 개인 비서로(Cortana – From Game Goddess To Personal Assistant)
Cortana 는 Bungie의 세계적으로 유명한 (Cortana)Halo 시리즈(Halo series) 게임 의 캐릭터 이름을 따서 명명되었습니다 . 그녀 는 게임 시리즈(game series) 의 영웅인 마스터 치프(Master Chief) 를 보조하는 AI입니다 . 이제 당신도 그녀의 상징적인 목소리(voice talk) 를 머릿속에서 말할 수 있습니다. 글쎄, 그것은 풀 사이즈 Halo Master Chief 수집가(Halo Master Chief collector) 의 헬멧 과 함께 헤드폰을 착용하는 경우입니다 .
Microsoft의 모바일 운영 체제(operating system) 는 사실상 더 이상 존재하지 않기 때문에 Cortana 는 주로 Windows 10 기능이며 Android 및 iOS 스토어(Android and iOS stores) 모두에 앱이 있습니다 . 이것은 그녀가 몇 가지 훌륭한 Windows 통합(Windows integration) 기능을 제공한다는 것을 의미하지만, 물론 사람들이 실제로 사용하는 모바일 시스템의 고유 기능은 아닙니다.
Google 어시스턴트 – 튜링 테스트 시작(Google Assistant – Taking On The Turing Test)
Google 은 의심할 여지 없이 세계 최고의 기술 회사 중 하나입니다. 특히 고급 AI 알고리즘(AI algorithms) 의 경우 . 따라서 Google 어시스턴트(Google Assistant) 가 최신 기술로 가득 차 있다는 것은 놀라운 일이 아닙니다.
어떤 면에서 이것은 약간의 문제가 될 수 있습니다. 기능 세트는 지속적으로 변화하고 있으며 Google 어시스턴트(Google Assistant) 가 어디에서 끝나고 다른 Google 서비스가 시작되는지 항상 명확하지 않습니다.
예를 들어, Google Duplex 는 Google의 (Google Duplex)AI 챗봇(AI chatbot) 이 (예를 들어) 지역 미용사에게 전화를 걸어 약속을 잡아 주는 매우 인상적인 서비스 입니다. 물어보기만 하면 됩니다. 그러나 Duplex 는 자체 프로젝트로 개발된 다음 확장 기능으로 Assistant 에 포함되었습니다.(Assistant)
Google 어시스턴트(Google Assistant) 사용 의 장점은 Android 와의 뛰어난 통합을 포함 하여 Google 서비스 와 긴밀하게 통합된다는 것 입니다.
테스트 방법(How We Tested)
이 비교의 이면에 있는 아이디어는 이 세 가지 보조자를 종이 사양에 따라 비교하는 것이 아닙니다. 대신 실제로 일상적으로 사용하는 방법에 대해 직접 비교하는 것이 좋습니다.
여기서 중요한 것은 사용자 경험과 이러한 뛰어난 봇이 실제로 원하는 작업을 수행하는지 여부입니다. 특정 어시스턴트(specific assistant) 가 특정 사용 사례 에 대한 (use case)킬러 기능(killer feature) 을 가지고 있다면 이것은 어쨌든 무의미합니다.
여기서 문제의 디지털 비서 3개를 테스트하기 위해 2개의 개별 장치를 사용했습니다. Siri 의 경우 작성 당시 최신 버전의 iOS 12가 설치된 iPad Pro 9.7 ” 태블릿 을 사용했습니다. (” tablet)다른 두 장치에는 Samsung Galaxy Note 10+ 를 사용했습니다 .
아이디어는 일상적인 사용에 대한 느낌을 얻는 것이므로 인터넷 검색 수행, (internet search)캘린더 알림(calendar reminder) 생성 및 응용 프로그램 시작을 포함하여 각각의 공통 작업이 정확히 동일하게 주어졌습니다.
음성 합성 품질(Voice Synthesis Quality)
어려운 기술 사양은 아닐지 모르지만 디지털 비서는 말할 때 얼마나 자연스럽게 들리느냐에 따라 살고 죽습니다. 이러한 응용 프로그램의 요점은 사용자를 대화형 인터페이스로 전환하는 것입니다. 즉, 거슬리는(Which) 로봇 음성(voice isn) 은 허용되지 않으며 대부분의 사람들이 그러한 제품을 사용하는 것을 꺼릴 것입니다.
이 세 가지 테스트에서 Google 어시스턴트(Google Assistant) 가 2위를 차지했으며 2 위는 Siri 이고 3위는 (Siri)Cortana 입니다. Google과 Apple의 제품 모두 최소한 북미 영어 버전에서는 자연스럽게 들리지만 (English)Cortana 가 좋지 않아 업그레이드가 필요한 것처럼 들립니다.
트리거 프레이즈 리액션 퍼포먼스(Trigger Phrase Reaction Performance)
최신 디지털 비서(digital assistant) 의 가장 큰 특징 중 하나 는 핸즈프리 사용입니다. 당신이 해야 할 일은 마법의 단어를 말하는 것뿐입니다. 그러면 조수가 도와줄 준비가 되어 있습니다. 적어도 이론상으로는. 그래서 우리는 방아쇠 단어(trigger word) 가 얼마나 잘 반응 했는지 확인하고 싶었습니다 .
(Please note)iOS의 경우 Siri 만 핸즈프리 트리거링을 지원합니다 . iOS에 Cortana와 Google 어시스턴트(Cortana and Google Assistant) 를 모두 설치할 수 있지만 한 마디로 실행할 수는 없습니다. 여기서 가장 간단한 해결 방법은 Siri 에게 다른 어시스턴트를 실행하도록 요청하는 것입니다. 이상하지만 절대적으로 필요한 경우 몇 초의 추가 작업이 추가됩니다.
Apple의 Siri 부터 시작하겠습니다 . "Hey Siri " 트리거 구문(trigger phrase) 을 사용하는 것은 즉각적이며 질문을 하기 전에 프롬프트를 기다릴 필요가 없습니다. Google 어시스턴트(Google Assistant) 도 마찬가지로 잘 수행되지만 기본적으로 이 방식으로 작동하지 않습니다. 적어도 Google 이외의 휴대전화에서는 그렇지 않습니다. 잠긴 경우에도 휴대 전화의 어느 곳에서나 디지털 지니를 소환할 수 있는 "Voice Match" 설정을 찾기 위해 메뉴를 꽤 많이 파고들었습니다.
Cortana의 앱 은 앱이 열려 있을 때만 트리거 (only )단어(trigger word) 에 응답합니다 . 그래서 정직하게 유용하지 않습니다.
지루하지만 유용한 것들(The Boring But Useful Stuff)
미리 알림 설정, 웹 페이지 열기, 앱 시작 및 기타 유사한 작업은 디지털 비서 사용의 기본입니다 . (bread and butter)그렇다면 이 세 가지는 어떻게 될까요?
웹 검색을 할 때 세 가지 조수 모두 완벽합니다. Cortana 는 Bing 을 사용하는데 , 이는 Google의 알고리즘을 선호하는 사람들에게는 좋지 않을 수 있습니다. 세 사람 모두 기쁜 마음으로 미리 알림을 설정하고, 메모를 작성하고, 달력에 약속을 기록했습니다.
iOS 에서 Siri 는 침착하게 앱을 실행 (Siri)하고 Apple Music 서비스(the Apple Music service) 를 사용하여 기꺼이 음악을 재생 합니다 . Android 에서 Google 어시스턴트(Google Assistant) 는 앱 실행 요청에도 기꺼이 따르지만 이상하게도 YouTube Music 에서는 제대로 작동하지 않습니다 . 곧 수정될 예정입니다. Cortana 는 앱 실행을 완전히 거부 하거나(apps or step) 앱 버블 전체에서 벗어나려고 합니다.
그것이 Cortana 가 우리를 위해 할 수 있는 전부입니다. 전혀 많지 않습니다 .(Which)
장치 통합 및 제어(Device Integration & Control)
디지털(Digital) 비서는 올바른 권한에 액세스할 수 있는 경우 장치를 핸즈프리로 작동하는 데 적합합니다. 최신 버전의 Siri 는 그녀가 있는 (Siri)Apple 장치(Apple device) 를 거의 완벽하게 제어 합니다. 그녀는 WiFi 또는 Bluetooth(WiFi or Bluetooth) 를 켜거나 끄는 것과 같은 많은 토글을 관리할 수 있습니다 . Siri 를 사용하여 VoiceOver 와 같은 손쉬운 사용 기능을 활성화할 수도 있습니다 .
Android 에서는 Google 어시스턴트(Google Assistant) 가 비트를 건너뛰지 않고 일반 설정을 토글했습니다 . 그러나 Cortana(Cortana) 는 관리할 수 없었으며, 이는 현시점에서 그리 놀라운 일이 아닙니다.
비언어적 사용(Nonverbal Use)
이러한 장치 의 가장 큰 특징(showcase feature) 은 단순히 대화를 통해 작업을 완료할 수 있다는 사실이지만 디지털 비서와 큰 소리로 대화하는 것이 항상 가능하거나 바람직한 것은 아닙니다. 버스에 있거나 회의 중이거나 조용히 있고 싶은 다른 장소에 있을 수 있습니다.
요즘에는 대부분의 비서가 문자 채팅 모드(text chat mode) 를 사용하여 대화를 중단하면서도 자연어 응답을 받을 수 있습니다.
그러나 Siri는 기본적으로 이 작업을 수행하지 않습니다. iOS 접근성 메뉴 로 이동 (accessibility menu and activate) 하여 Siri에게 입력을(Type to Siri) 활성화해야 합니다. Cortana와 Google Assistant(Cortana and Google Assistant) 모두 기본적 으로 텍스트 입력(text input) 을 사용할 수 있으므로 여기에서 약간의 추가 크레딧을 얻습니다.
음성 인식 성능(Voice Recognition Performance)
디지털 비서는 당신을 얼마나 잘 이해할(assistant understand) 수 있습니까? 이 질문에는 두 부분이 있습니다. 첫 번째는 연설을 텍스트로 정확하게 변환하는 것과 관련이 있습니다. 당신이 말하는 내용이 자동 고침처럼 뒤죽박죽으로 바뀌면 별로 소용이 없습니다. 질문의 두 번째 부분은 귀하가 말한 내용이 소프트웨어에서 얼마나 잘 구문 분석되는지와 관련이 있습니다.
세 명의 어시스턴트 모두 문제 없이 우리가 말한 내용을 이해하고 올바르게 구문 분석했습니다. 여기에 보고할 내용은 많지 않지만 2019년의 음성 인식 및 AI(voice recognition and AI) 는 꽤 인상적입니다.
평결 - 누가 정상에 올랐습니까?(The Verdict – Who Came Out on Top?)
Apple 사용자의 경우 판결은 명확합니다. Siri 는 (Siri)최첨단 기술(cutting-edge technology) 측면에서 객관적으로 Google Assistant 에 뒤떨어져 있지만 iOS 및 Apple 의 하드웨어(s hardware) 와의 긴밀한 통합 은 최고의 전반적인 경험을 제공한다는 것을 의미합니다.
특히 거의 완벽한 핸즈프리 성능을 감안할 때. Apple Music 과 같은 Apple 서비스 도 사용 하고 Siri 단축키를 미세 조정하는 데 시간을 할애 한다면 iOS 기기에서 다른 디지털 비서가 가하는 한계를 견디는 것을 상상하기 어렵습니다.
어쨌든 Siri(Siri) 에 액세스할 수 없는 Android 사용자의 경우 상황 이(Android) 더 흥미로워집니다. Galaxy Note 10+테스트 장치(test device) 의 Cortana와 Google Assistant 사이(Between Cortana and Google Assistant) 에서 Google Assistant 가 분명히 우위를 점하고 있습니다. Cortana가 Bing 을 검색 엔진(search engine) 으로 사용하는 것은 이해할 수 있지만 Bing 은 일관되게 덜 만족스러운 검색 결과를 제공했으며 이는 그에 대해 다소 심각한 표시입니다.
그러나 결국 Cortana 는 (Cortana)Android 에서 매우 제한된 애플리케이션입니다 . Windows 에서 (Windows)Cortana 와 함께 존재하는 교차 기능으로 인해 유용한 추가 앱이 될 수 있지만 Google Assistant 가 바로 거기에 있고 제대로 통합되어 있는 경우 기본 Android 도우미 로 권장할 수 없습니다.(Android assistant)
Siri, Google Assistant, & Cortana – Three Digital Assistants Compared
If you’re old enough to rеmember trying voice dictatіon software in the 90s, then you know the true meаning of tedium. If you wanted to type out an email or a memo using your vоіcе, it requіred hours of traіning, a painfullу slow speaking speed and ultimately a pretty usеless piece of text.
Today things couldn’t be more different. Thanks to major advances in machine learning and cloud computing power, digital voice recognition systems can understand you nearly as well as another human being.
Which is why it’s possible to ship every smartphone, laptop and tablet with a built-in Digital Assistant. The three main players are Siri from Apple, Cortana from Microsoft and Google Assistant, from, well, Google. In case it isn’t apparent from the name.
All three assistants perform similar jobs and also have their own unique value propositions to offer. It’s probably impossible to objectively say which assistant is the “best”, but comparing them along specific common tasks is a useful exercise. For every person reading this, one of these assistants is the best match to your specific circumstances.
So for this three-way comparison the goal will be to showcase the weaknesses and strengths of each option so that you can make an informed choice about who to go with. Before we do that however, let’s introduce our three lovely contestants.
Siri – A True Original
Siri first launched as an exclusive feature of the iPhone 4S. Consider that the iPhone 11 is launching in 2019, that makes Siri one of the oldest digital assistants today.
When the first teasers for Siri were aired, it seems a little like science fiction. Amazing voice synthesis and seemingly flawless voice recognition were real showstoppers. In retrospect, Siri involved some measure of smoke, mirrors and a relatively limited domain of high-quality functions. Since then she’s bulked up with intelligence and features, but the popular opinion seems to be that the old girl is no longer the technology leader.
Regardless, this assistant is limited to the Apple ecosystem so the greater question is whether Apple aficionados should stick with the store-brand assistant their devices ship with or not.
Cortana – From Game Goddess To Personal Assistant
Cortana is named after the character from Bungie’s world-famous Halo series of games. She’s the AI that assists the Master Chief, the hero of the game series. Now you too can have her iconic voice talk in your head. Well, that is if you wear headphones along with that full-size Halo Master Chief collector’s helmet.
Since Microsoft’s mobile operating system is effectively no more, Cortana is mainly a Windows 10 feature, with apps on both Android and iOS stores. This means she offers some great Windows integration features, but is of course not native to any mobile system people are actually using.
Google Assistant – Taking On The Turing Test
Google is undoubtedly one of the top technology companies in the world. Especially when it comes to advanced AI algorithms. So it should be no surprise that the Google Assistant is stuffed to the gills with the latest technology.
In some ways this can be a bit of a problem. The feature set is constantly shifting and it’s not always clear where Google Assistant ends and other Google services begin.
For example, Google Duplex is an incredibly impressive service where Google’s AI chatbot will phone (for example) the local hairdresser and make an appointment for you. All you have to do is ask. However, Duplex was developed as its own project and then rolled into the Assistant as an extension.
The upside of using Google Assistant is that it’s tightly integrated with Google services, which includes great integration with Android.
How We Tested
The idea behind this comparison is not to compare these three assistants according to their on-paper specifications. Instead the idea is to compare them, hands-on in terms of how you’d actually use them on a daily basis.
What matters here is the user experience and whether these brilliant bots actually do what you want them to. If a specific assistant has a killer feature for your specific use case, then this is all moot anyway.
We used two separate devices to test the three digital assistants in question here. In the case of Siri we used an iPad Pro 9.7” tablet, with the latest version of iOS 12 at the time of writing. For the other two devices, we used a Samsung Galaxy Note 10+.
Since the idea is to get a feel for day-to-day use, each one was given exactly the same common tasks, which include doing an internet search, creating a calendar reminder and starting an application.
Voice Synthesis Quality
It might not be a hard technical specification, but a digital assistant lives and dies by how natural it sounds when speaking. The whole point of these applications is to shift the user over to a conversational interface. Which means a jarring, robotic voice isn’t acceptable and would put most people off from using such a product.
In our testing of these three, it’s the Google Assistant that comes out on top, with Siri second and Cortana a rather distant third. Both Google and Apple’s products sound natural, at least in their North American English iterations, but poor Cortana sounds like she needs an upgrade.
Trigger Phrase Reaction Performance
One of the big features of any modern digital assistant is hands-free use. All you have to do is say the magic word and the assistant is ready to help. At least in theory. So we wanted to see how well the trigger word was reacted to.
Please note that in the case of iOS, only Siri supports hands-free triggering. Although you can install both Cortana and Google Assistant on iOS, you can’t launch them with just a word. The simplest workaround here is to ask Siri to launch the other assistant. It’s weird, but if you absolutely need to, this adds just a few seconds of extra work.
Let’s start with Apple’s Siri. Using the “Hey Siri” trigger phrase is instant and you don’t have to wait for a prompt before asking your question. Google Assistant performs just as well, but it doesn’t behave this way by default. At least not on non-Google phones. There’s quite a bit of digging in the menu to finding the cryptically-named “Voice Match” setting, which lets you summon the digital genie from anywhere on your phone, even if its locked.
Cortana’s app only responds to the trigger word when the app is open. So not all that useful to be honest.
The Boring But Useful Stuff
Setting reminders, opening webpages, starting apps and other similar tasks are the bread and butter of using a digital assistant. So how do these three fare?
When it comes to doing web searches, all three assistants are perfectly fine. Cortana uses Bing, which might not be a good thing for people who prefer Google’s algorithms. All three were happy to set reminders, take memos and put appointments on the calendar.
On iOS Siri launches apps with aplomb and is happy to play music using the Apple Music service. On Android, Google Assistant also happily complies with app launch requests, but strangely doesn’t work properly with YouTube Music. This will hopefully be fixed soon. Cortana flat out refuses to launch any apps or step outside her app bubble as a whole.
That’s all Cortana would do for us. Which is not much at all.
Device Integration & Control
Digital assistants are great for hands-free operation of your device if they can access the right permissions. The latest version of Siri has almost complete control of the Apple device she resides on. She can manage a large number of toggles, such as flipping WiFi or Bluetooth on or off. You can activate accessibility features such as VoiceOver using Siri as well.
On Android, Google Assistant did just as well, toggling common settings without skipping a beat. Cortana was however unable to manage, which is not too surprising at this point.
Nonverbal Use
While the big showcase feature of these devices is the fact that you can simply talk at them to get things done, it’s not always possible or desirable to have a loud conversation with your digital assistant. You may be on the bus, in a meeting or some other place where you’d rather stay quiet.
These days most assistants have a text chat mode where you can take the conversation off the air, but still get natural language responses.
Siri does not do this by default however – you have to go to the iOS accessibility menu and activate Type to Siri. Both Cortana and Google Assistant had text input available by default, so they get a small amount of extra credit here.
Voice Recognition Performance
How well can a digital assistant understand you? There are two parts to this question. The first has to do with accurate conversion of your speech to text. It’s not much use if what you say turns into an autocorrect-like garbled mess. The second part of the question has to do with how well what you’ve said is parsed by the software.
All three assistants understood what we said with no problem and parsed it correctly. Not much to report here but that voice recognition and AI in 2019 is pretty impressive.
The Verdict – Who Came Out on Top?
For Apple users, the verdict is clear. Although Siri objectively lags behind Google Assistant in terms of cutting-edge technology, its deep integration with iOS and Apple’s hardware means it provides the best overall experience.
Especially given its virtually flawless hands-free performance. If you also use Apple services such as Apple Music and spend some time fine-tuning Siri shortcuts, then it’s hard to imagine putting up with the limitations and hoops other digital assistants pose on iOS devices.
For Android users, who don’t have access to Siri anyway, things get more interesting. Between Cortana and Google Assistant on our Galaxy Note 10+ test device, Google Assistant clearly has the upper hand. Cortana’s use of Bing as its search engine is understandable, but Bing consistently gave less satisfactory search results, which is a rather serious mark against it.
In the end however, Cortana is a very limited application on Android. The cross-functionality that exists with Cortana on Windows might make it a useful additional app, but it can’t be recommended as your primary Android assistant when Google Assistant is right there and as well-integrated as it is.