Hlasoví asistenti a chytré reproduktory: boj o chytrou domácnost

Zdá se, že před hlasovými asistenty a chytrými reproduktory není úniku. Některé prognózy předpovídají růst trhu z 2.7 miliardy USD v roce 2018 na 11.8 miliardy USD v roce 2023. V září 2018 18 % dospělých v USA používalo měsíčně chytrý reproduktor a očekávalo se, že do konce roku 2018 bude mít téměř 30 % dospělých v USA přístup k chytrému reproduktoru, přičemž 80 % z nich využívá službu měsíčně.

Hlasové asistenty jsou cloudové služby, které přijímají hlasové příkazy inteligentní reproduktory a další zařízení, převést řeč na text, interpretovat výsledný jazyk, zjistit záměr příkazu a používat „dovednosti“ k určení a provedení vhodných akcí; buď prostřednictvím chytrých reproduktorů, nebo prostřednictvím akcí jiných zařízení v domácnosti, která jsou připojena k internetu.

V současné době má Amazon Alexa vedoucí postavení na trhu s hlasovými asistenty, Google Assistant rychle dohání a Apple Siri expanduje také. Zatímco každý asistent závisí na mluvčích, služby, které zprostředkovávají, jsou skutečnou hodnotou pro obchodní modely jejich společnosti. Amazon umožňuje nákupy z jejich obchodní služby, Google upřednostňuje přístup k jejich službám a využívá data pro reklamu a Apple využívá Siri k podpoře svého ekosystému hardwaru a služeb.

Kromě toho poskytovatelé reproduktorů třetích stran, například B&O, Sonos a Harman Kardon, nabízejí své vlastní chytré reproduktory využívající služby hlasových asistentů nabízené těmito třemi lídry na trhu.

Každý z velkých tří poskytovatelů hlasových asistentů se chce připojit k velkému ekosystému připojených zařízení, ovládaných prostřednictvím svých hlasových asistentů. Některé z těchto ekosystémů se rychle rozšířily. Amazon tvrdí, že více než 28,000 4,500 chytrých domácích zařízení fungujících s Alexou od více než 70,000 10,000 různých výrobců a více než 1,600 XNUMX dovedností Alexa. Google Assistant si nárokuje více než XNUMX XNUMX zařízení od XNUMX XNUMX značek.

Důležitou otázkou pro spotřebitele je, ke kterému ekosystému hlasových asistentů by se měli přihlásit. Zatímco Amazon Alexa a Google Assistant mají dominantní vedení v oblasti inteligentních hlasových asistentů založených na reproduktorech, Apple Siri se široce používá s chytrými telefony, tablety a počítači.

Zatím se zdá, že spotřebitelé používají své chytré reproduktory převážně pro zábavní a informační služby, přičemž odpovědi zprostředkovávají související chytré reproduktory. Ovládání zařízení pro chytrou domácnost se zatím nejeví jako hlavní faktor při používání hlasových asistentů.

Podle některých průzkumů se totiž zdá, že používání hlasových asistentů u velkých spotřebičů klesá.

I když se využití může zpomalit, přijetí chytrých reproduktorů nikoli. To znamená, že výrobci zařízení nyní musí podporovat všechny hlavní hlasové asistenty nebo riskovat, že někdo nebude brát v úvahu jejich značku (značky). Pro zjednodušení používání svých zařízení se někteří výrobci snaží používat vestavěné mikrofony a reproduktory k jejich přímému připojení ke službám hlasových asistentů v cloudu, čímž eliminují potřebu chytrých reproduktorů. Podle analytické organizace VoiceBot se však tento trend teprve rodí a zatím nemá žádné významné využití.(1)

ČTĚTE VÍCE
Jaký je hlavní problém Kia Seltos?

Návrh na odstranění reproduktorů má však svou vlastní výzvu – pokud návrháři zařízení používají vyhrazené hlasové čipy pro zařízení, např. pro Amazon Alexa nebo pro Google Assistant, potřeboval by výrobce jeden pro každý VA, který chtěl použít?

Když se hlasoví asistenti používají se spotřebitelskými zařízeními, nejoblíbenější jsou jednoduché jednočinné příkazy. Například změna teploty v městském domě, kde termostaty v několika podlažích mohou reagovat na jediný hlasový příkaz, ušetří uživateli chození po schodech nahoru a dolů. To je jednoznačně pohodlí.

Kromě skromného termostatu výrobci propojují rovnováhu kuchyně – od ledniček po sporáky s připojením k internetu. Náš neformální průzkum však ukazuje, že pouze malá část spotřebitelů skutečně připojuje svá připojitelná zařízení k internetu. Méně z nich stále umožňují podporu hlasového asistenta. Připojení nemá žádnou bezprostřední hodnotu pro spotřebitele. Ovládání rozsahu v rámci vaření jídla vyžaduje mnohem složitější interakce než nastavení pokojové teploty jediným příkazem.

Rozpor mezi tím, co spotřebitelé chtějí, a tím, co si výrobci myslí, že chtějí v propojených zážitcích, byl objasněn v IBM Institute for Business Value. Provedli průzkum mezi vedoucími pracovníky a spotřebiteli výrobců a seřadili motivace pro digitální spotřebitelské zážitky.

Vedoucí pracovníci si mohou oddechnout a přehodnotit, zda poskytují to, co zákazníci skutečně chtějí: více času, více pohodlí, rychlejší výsledky a jednodušší procesy. Kam se vejde reproduktor – nebo hlasový příkaz? Jak – a komu – pomáhá?

V mnoha ohledech hlasoví asistenti jednoduše nahrazují stisknutí tlačítek hlasovými příkazy. Je stále na spotřebitelích, aby zvážili kontext akce. Když se na dosažení cíle na vysoké úrovni, jako je vaření jídla, podílí více zařízení, uživatelé musí zorganizovat akce zařízení mezi sebou navzájem as dalšími činnostmi potřebnými k dosažení cíle. Asistent není chytrý a je sporné, zda říkat reproduktoru, aby zvýšil teplotu trouby, je příliš užitečné. Zvažte tyto body

  • Hlasoví asistenti používají jednotlivé příkazy. Prozatím se skládají převážně z pevných frází. Efektivně stisknou jedno tlačítko nebo nastaví jeden číselník.
  • S tím, jak je k dispozici flexibilnější technologie porozumění přirozenému jazyku, může být výklad řečových příkazů nejednoznačný. S příkazy, které vedou k akcím, mohou být nedorozumění riskantní. Opravdu jsem chtěl nastavit troubu na 600 stupňů? Potřebujeme „ochranné zábradlí“?
  • Hlasoví asistenti podporují pouze jednosměrné „konverzace“. Spotřebiče nemohou odvolat a požádat o objasnění záměru. Zabudování kontrol do dovedností prováděných v cloudu tento problém zcela nevyřeší.
  • Příkazy jsou nezávislé na stavu zařízení. Uživatel musí vědět, zda je trouba zapnutá, kdy je třeba snížit teplotu atd.
  • Bezstavový aspekt hlasových příkazů také omezuje schopnost podporovat akční sekvence, pokud tyto akce závisí na stavu zařízení. Zapnul jsem výfuk předtím, než jsem zapnul hořák na sporáku?
  • Spotřebiče obecně nemohou zahájit konverzaci nebo upozorňovat například na to, že pračka prádla je hotová nebo že hrnec na sporáku vaří.
  • V mnoha případech je prostřednictvím hlasového asistenta dostupná pouze část funkcí zařízení. To může být z bezpečnostních důvodů. Hořák sporáku by měl být zapnutý pouze tehdy, když je někdo v kuchyni. Nebo to může být proto, že funkce je složitá a závisí na stavu spotřebiče, např. přiveďte vodu k varu a těstoviny uvařte do měkka.
  • Hlasoví asistenti nemohou integrovat kontextová data, například kdo je v kuchyni? je v lednici mléko?
  • Obvykle si nepamatují historii – jak jsme to udělali naposledy?
  • Závisí na připojení k internetu a na překážkách, které má v každé domácnosti, a kvůli kterým je méně spolehlivé.
ČTĚTE VÍCE
Jaký je dojezd Fordu f150 hybrid v KM?

Tyto nedostatky omezují hlasové asistenty ve zvýšení jejich statusu z transakčního na skutečně užitečné. Potřebují sémantickou úroveň interakce pro podporu složitějších činností. Akce hlasového asistenta nelze přizpůsobit konkrétním situacím v domácnosti, jako je zvažování, kdo je doma na večeři nebo jaké ingredience jsou po ruce. Nedostatek historie brání schopnosti dozvědět se o preferencích spotřebitelů. A zabraňuje automatizaci akcí, takže nevyžadují žádný hlasový vstup nebo jiný vstup – díky tomu jsou univerzálnější. Řízení světel nebo teploty by mohlo být zcela automatizováno pouhou lidskou přítomností, aniž by bylo vyřčeno/slyšeno/chybně vykládáno/chybně interpretováno jediné slovo.

Úvahy o ochraně osobních údajů se stávají stále větší překážkou pro spotřebitele při přijímání hlasových asistentů. Hlasová data jsou přenášena do cloudu k analýze, kde často zůstávají natrvalo uložena.

Zatímco obecně jsou do cloudu odesílány pouze hlasové příkazy vydané po probuzení, některé nehody ilustrují vážná rizika. Přidružený software je ze své podstaty složitý, lze očekávat občasné poruchy. I když však nedojde k selhání softwaru, data hlasového asistenta, zejména v kombinaci s jinými daty, představují potenciálně vážné ohrožení soukromí; je to extrémně podrobný pohled na domovy lidí, jak je vysvětleno zde, zde a zde. Na sociálních sítích existují výroky o nevyvěšení špinavého prádla; hlasoví asistenti však mohou být mnohem rušivější. To by mohlo vést ke zpětné reakci v používání připojených zařízení.

V tuto chvíli jsme teprve na začátku cesty ke zmírnění rizik ochrany soukromí. Rizika ochrany osobních údajů hlasového asistenta jsou jen součástí širší veřejné konverzace o soukromí spotřebitelů, která, jak se zdá, nabírá na síle. Velká část řešení bude muset pocházet z regulací, jako je legislativa GDPR v Evropě. Začínají se vybírat pokuty a Google byl mezi prvními a největšími. Mohou však existovat také technická řešení, která zmírňují rizika a poskytují spotřebitelům větší kontrolu nad jejich daty. Příkladem je nedávný návrh využívající technologii blockchain k ochraně dat spotřebitelů.

Zvažte také poslední bod. Hlasové příkazy do zařízení jsou často „fyzické“ požadavky. spusťte spotřebič nebo otevřete dveře. To také otevírá potenciál pro vážná bezpečnostní a bezpečnostní rizika kromě soukromí. Zatímco potenciální škody při domácím použití jsou omezeny na tento domov, tato rizika jsou součástí širšího souboru rizik spojených s internetem věcí.

ČTĚTE VÍCE
Proč moje auto zní jako diesel, když ho nastartuji?

Vzhledem k tomu, že výpočetní výkon v zařízeních roste a zároveň se zlevňuje, lze do zařízení zabudovat velkou část funkce hlasového asistenta, která se dnes provádí v cloudu. Tím se zlepší spolehlivost i soukromí. Spotřebitelům také poskytne větší kontrolu a podpoří personalizaci a přizpůsobení konkrétním kontextům.

Abychom poskytli skutečné pohodlí a snadné použití, musíme používat hlasové ovládání ve spojení s dalšími senzorovými vstupy a externími datovými zdroji. Toho nejlépe dosáhnou aplikace, které mají přístup k široké sadě dat: stav zařízení, všechny funkce zařízení, senzory v prostředí, související zařízení a externí zdroje dat. Tyto aplikace také mohou vytvářet a využívat osobní profily a historii. Uchovávání dat na místní úrovni zlepšuje soukromí.

Ke skutečnému pokroku však nedochází pouhým převáděním stisknutí tlačítka a knoflíku na hlasové příkazy. Potřebujeme použít umělou inteligenci ke zvýšení sémantické úrovně interakcí tím, že se zaměříme na cíle činnosti na vysoké úrovni, spíše než na jednotlivé operační akce. To přesouvá pozornost od spotřebičů k životnímu účelu, pro který jsou používány. Musíme začít přehodnocením toho, jak dosáhnout cílů, jako je vaření jídla, udržování čistého oblečení, úspora energie nebo udržování bezpečí domova. Poté můžeme určit, jaké druhy zařízení mohou tyto cíle nejlépe podporovat a jak je používat v personalizovaných kontextech. Vidíme, jak se někteří výrobci ubírají tímto směrem. Klíčovou výzvou je integrovat hlasové asistenty do těchto širších a schopnějších platforem.

Tato změna zaměření nám pomůže realizovat příslib chytré domácnosti. Náš příští blog se podívá na to, jak toho dosáhnout!

Martin G. Kienzle je lídrem elektronického průmyslu ve výzkumu IBM. Jeho zájmy jsou technologie internetu věcí (IoT) a obchodní trendy, služby IoT a obchodní modely. Sledujte ho na twitteru @mg_kienzle pro zprávy a perspektivu z chytré domácnosti.

Pokud jste se dostali až sem, určitě byste se měli spojit s Martinem

Podívejte se na jeho nejnovější spolupráci s vedením 5G

Podívejte se na Martinovu práci na případech použití pro hybridní cloud v Life in the AI ​​Age ze srpna

on edge computing, v jarním vydání Future of Electronics

poznámky na závěr:

1 >> voice-assistant-consumer-adoption-report-2018-voicebot.pdf from voicebot.ai

ČTĚTE VÍCE
Představuje Mercedes novou třídu E?

Doba čtení: 3 minuty

Siri, Alexa a Google změnily způsob, jakým lidé nacházejí informace online, a otevřeli nové způsoby vyhledávání. Před úsvitem hlasových asistentů vidíme tento druh technologie pouze ve filmech a televizních pořadech. I když existuje mnoho výhod, existují také nevýhody těchto funkcí hlasového vyhledávání. Lidé často zažívají frustraci při provádění hlasového vyhledávání a často náhodně přivolají své osobní asistenty díky neúmyslným hlasovým příkazům. Podívejme se na některé z nejpozoruhodnějších scénářů, kde hlasoví asistenti stále zaostávají.

1. Nesrozumitelná slova

Pro hlasové asistenty může být velmi obtížné porozumět vysloveným slovům, která nejsou ve slovníku. I když se tento trend postupem času zlepšuje. Pokud například někdo požádá hlasového asistenta, aby otevřel aplikaci, asistent ji nemusí rozpoznat. Požádejte asistenta, aby otevřel web, a ten nemusí rozumět syntaxi. Řekněme, že někdo požádá hlasového asistenta, aby něco koupil, ale neříká nic konkrétního. Pro asistenty může být velmi obtížné zjistit, co chcete koupit, zvláště pokud se jedná o jedinečný předmět. Možná budete muset být konkrétnější nebo říct název produktu, abyste dostali to, co chcete.

2. Nerozumění příkazům

Když provádíte hlasové vyhledávání, očekáváte, že okamžitě získáte správný výsledek. Pokud však hlasový asistent nerozumí tomu, co požadujete, budete se muset zopakovat nebo zadat vyhledávací dotaz ručně. To je ještě větší frustrace, protože budete muset svůj vyhledávací dotaz (ten, který hledáte) znovu vyslovit nahlas. To může být nepříjemné, nepříjemné a někdy i trapné, pokud mluvíte s cizím člověkem, zvláště pokud při čekání ve frontě zdržuje konverzaci na svém mobilním telefonu.

3. Poskytnutí nesprávných informací

Hlasoví asistenti jsou dobří v poskytování faktických informací, ale někteří z nich mají potíže s poskytováním slušných informací kvůli nesprávné interpretaci nebo chybné identifikaci konkrétního dotazu. Zdá se, že tento problém je výraznější u hlasových asistentů, zejména pokud jde o nesprávnou identifikaci zdroje hlasového příkazu.

Výsledkem je narušená uživatelská zkušenost, kdy lidé musí svůj vyhledávací dotaz několikrát opakovat, aby získali správné informace. To je frustrující, když něco hledáte, a musíte se několikrát opakovat, abyste dostali odpověď, kterou hledáte. Totéž můžete provést zadáním vyhledávání v prohlížeči, ale získáte přesnější výsledky, protože svůj dotaz můžete upravovat za běhu.

ČTĚTE VÍCE
Jaké je nejlevnější Bentley?

4. Rozptylování během osobní konverzace

I když je dobré, že si pomocí hlasových asistentů můžete trochu usnadnit život, jsou chvíle, kdy mohou být při pokusu o konverzaci s někým kontraproduktivní. To platí zejména tehdy, když s někým mluvíte tváří v tvář. Představte si to: jste v obchodě vyzvednout nějaké potraviny a váš hlasový asistent najednou zabzučí a zeptá se vás, jestli ještě něco nepotřebujete. Pravděpodobně nechcete mluvit nahlas s pokladní, když mluví s vámi.

5. Problémy s integrací softwaru

Hlavními hráči v oblasti hlasových asistentů jsou Siri, Google Assistant a Alexa. Tito asistenti jsou stále daleko k dokonalosti, a proto je úžasné, že byli integrováni do tolika různých typů zařízení. Navzdory skutečnosti, že existuje mnoho zařízení a aplikací, které jsou kompatibilní s hlasovými asistenty, stále existují četné problémy s integrací softwaru.

Můžete například požádat svého hlasového asistenta, aby otevřel aplikaci na vašem smartphonu, ale nemusí to fungovat. Pokud jste si na chytré televizi nastavili hlasového asistenta, obvykle byste museli svůj vyhledávací dotaz zakřičet. To vám nedělá dobře, zvláště pokud máte v místnosti další lidi.

Sečteno a podtrženo – klávesnice vládne nejvyšší

Hlasoví asistenti ušli od Siri v roce 2011 dlouhou cestu, ale stále je co zlepšovat. Přesto není nic lepšího než napsat vyhledávací dotaz a okamžitě získat, co potřebujete. Virtuální a fyzické klávesnice jsou stále nejlepším způsobem, jak najít informace online a procházet aplikacemi a weby.

Fleksy je zde, aby pomohla značkám vytvořit jejich vlastní skvělé produkty prostřednictvím naší sady SDK pro klávesnici s bílým štítkem. Poskytujeme vám nejmodernější řešení navržené pro snadnou integraci a je snadno tou nejlepší technologií klávesnice pro jakoukoli aplikaci nebo zařízení. Spojte se s Fleksy ještě dnes a vytvořte si vlastní klávesnici pro svou značku!