AQUE­LE PAPO-CABE­ÇA (E DIGI­TAL) COM O CON­SU­MI­DOR

O DESEM­BAR­QUE DA ALE­XA, DA AMA­ZON, É APON­TA­DO COMO UM RECO­ME­ÇO PARA A MAS­SI­FI­CA­ÇÃO DO USO DE ASSIS­TEN­TES DE VOZ NO RELA­CI­O­NA­MEN­TO DO CON­SU­MI­DOR. E NÃO FAL­TAM BONS EXEM­PLOS PARA A TEC­NO­LO­GIA

POR IVAN VEN­TU­RA

pri­mei­ra ver­são de “Bla­de Run­ner – O Caça­dor de Androi­des”, de 1982, é apon­ta­da como um dos fil­mes pre­cur­so­res de um movi­men­to cul­tu­ral cha­ma­do ciber­punk – uma espé­cie de sub­ca­te­go­ria da fic­ção cien­tí­fi­ca que exi­be um futu­ro som­brio e pes­si­mis­ta na rela­ção entre homem e máqui­na. Diri­gi­do pelo pre­mi­a­do dire­tor Ridley Scott, a his­tó­ria nar­ra o con­fron­to entre huma­noi­des (robôs que pare­cem gen­te) e pes­so­as de car­ne e osso nas ruas de Los Ange­les em um dis­tan­te ano de 2019.

Feliz­men­te, o ano de 2019 da vida real não virou o apo­ca­lip­se ciber­né­ti­co exi­bi­do no fil­me. No entan­to, ao menos uma pro­fe­cia se con­cre­ti­zou: a huma­ni­da­de já con­ver­sa com robôs, não neces­sa­ri­a­men­te com os huma­noi­des do fil­me, mas com pro­gra­mas de com­pu­ta­do­res conhe­ci­dos como “assis­ten­tes de voz”.

De acor­do com um levan­ta­men­to fei­to pela agên­cia eMar­ke­ter, somen­te nos EUA, pou­co mais de 111,8 milhões já falam ao menos uma vez por mês com assis­ten­tes de voz como Ale­xa, Goo­gle Assis­ten­te e Siri, segun­do pes­qui­sa da eMar­ke­ter. No Bra­sil, os núme­ros ain­da são incer­tos, mas uma recen­te pes­qui­sa afir­ma que 49% dos bra­si­lei­ros que pos­su­em um smartpho­ne (e não neces­sa­ri­a­men­te um celu­lar) já con­ver­sam com um assis­ten­te de voz, segun­do a agên­cia de mar­ke­ting digi­tal iPros­pect.

O papo entre homem e máqui­na ain­da não é pro­fun­do e sequer pode­ria ser cha­ma­do de “uma con­ver­sa diver­ti­da”. No entan­to, essa tec­no­lo­gia já exi­be um poten­ci­al impor­tan­te para ocu­par lugar de des­ta­que no uni­ver­so do rela­ci­o­na­men­to com o cli­en­te – e é exa­ta­men­te o que já está ocor­ren­do.

EFEI­TO AMA­ZON

Um recen­te estu­do fei­to pela Ado­be, empre­sa de soft­ware que desen­vol­veu um kit para a cons­tru­ção de jor­na­das de diá­lo­gos para assis­ten­tes de voz, mos­tra que empre­sas do mun­do todo estão real­men­te ani­ma­das com essa tec­no­lo­gia. Segun­do o levan­ta­men­to, de um total de 400, 91% delas afir­mam que inves­ti­ram ou vão inves­tir vul­to­sas quan­ti­as de dinhei­ro na cri­a­ção de robôs falan­tes até o fim des­te ano para as mais vari­a­das fina­li­da­des.

Esta­mos falan­do de inves­ti­men­tos supe­ri­o­res a US$ 5 milhões. Além dis­so, o mes­mo estu­do mos­tra que quem inves­tiu não se arre­pen­deu e o fará de novo em 2020. O estu­do mos­tra que 94% dos exe­cu­ti­vos pla­ne­jam aumen­tar esses inves­ti­men­tos no pró­xi­mo ano”, dis­se Jef­fer­son Arau­jo, tech­no­logy advo­ca­te da Ado­be.

Segun­do Arau­jo, o Bra­sil é um dos paí­ses cita­dos na pes­qui­sa e que des­pon­tam como um dos mer­ca­dos mais pro­mis­so­res para o uso mas­si­fi­ca­do do assis­ten­te de voz. Hoje, o País já con­ta com diver­sos assis­ten­tes falan­do em por­tu­guês, caso da Siri, do Goo­gle Assis­ten­te, da BIA do Bra­des­co, da Aura da Vivo, além de robôs usa­dos nas áre­as de rela­ci­o­na­men­to com o cli­en­te das empre­sas. Eles estão embar­ca­dos ou podem ser aces­sa­dos em dis­po­si­ti­vos como cai­xas de som por­tá­til, smartpho­nes, tablets, car­ros, entre outros dis­po­si­ti­vos. Ou seja, o assun­to não é novo no Bra­sil, mas, ao mes­mo tem­po, quan­tos de nós usa­mos essa tec­no­lo­gia para algum caso prá­ti­co? O fato é que o con­su­mi­dor bra­si­lei­ro ain­da não “des­co­briu” as mara­vi­lhas des­sa tec­no­lo­gia.

DESEN­VOL­VE­MOS UMA MANEI­RA DE A ALE­XA FALAR PALA­VRAS EM INGLÊS DE UMA FOR­MA MAIS COLO­QUI­AL. A GEN­TE EFE­TI­VA­MEN­TE CRI­OU UMA TER­CEI­RA LÍN­GUA DEN­TRO DA ALE­XA, QUE É O INGLÊS BRA­SI­LEI­RO

RICAR­DO GAR­RI­DO, DA AMA­ZON

Até por esse moti­vo, a che­ga­da da Ale­xa falan­do em por­tu­guês, no iní­cio de outu­bro, é apon­ta­da como um reco­me­ço para a popu­la­ri­za­ção des­sa tec­no­lo­gia. Até o momen­to, os sinais são posi­ti­vos, prin­ci­pal­men­te pela quan­ti­da­de de empre­sas que abra­ça­ram a tec­no­lo­gia e cri­a­ram um total de apro­xi­ma­da­men­te 400 coman­dos de voz ou skills, como dizem os envol­vi­dos nes­se tipo de tec­no­lo­gia. Em comum, mui­tas des­sas habi­li­da­des de voz já con­fe­rem uma carac­te­rís­ti­ca comum: pres­tar infor­ma­ções às pes­so­as. Essa seria a pri­mei­ra onda de uso des­sa tec­no­lo­gia.

De fato, a infor­ma­ção está na pri­mei­ra onda de uso mas­si­fi­ca­do da Ale­xa no Bra­sil. Mas não é ape­nas isso. Ao todo, exis­tem três pos­si­bi­li­da­des: infor­ma­ção, músi­ca e smart home (fun­ci­o­na­li­da­des para casas inte­li­gen­tes)”, dis­se Ricar­do Gar­ri­do, coun­try mana­ger da Ale­xa no Bra­sil.

Um exem­plo foi o Bra­des­co, que anun­ci­ou a inte­ra­ção entre a Ale­xa e a BIA (a inte­li­gên­cia arti­fi­ci­al do ban­co e que tam­bém tem o papel de fun­ci­o­nar como uma assis­ten­te de voz). Por meio de apa­re­lhos da linha Ama­zon Echo, o cli­en­te pode con­sul­tar o sal­do da con­ta e os dados. Além dis­so, já é pos­sí­vel pagar até uma con­ta. “Nos­so obje­ti­vo sem­pre foi dis­po­ni­bi­li­zar a BIA onde o cli­en­te esti­ver para que ele tenha uma expe­ri­ên­cia natu­ral. O lan­ça­men­to da BIA na Ale­xa é mais um pas­so des­sa estra­té­gia, pro­mo­ven­do a inte­ra­ção de manei­ra con­ve­ni­en­te e intui­ti­va”, afir­ma Wal­ki­ria Schir­r­meis­ter Mar­chet­ti, CIO do Bra­des­co.

Outra com­pa­nhia que anun­ci­ou uma skill para a Ale­xa foi a LATAM Air­li­nes Bra­sil. Por meio de coman­dos de voz, é pos­sí­vel con­sul­tar voos ou pla­ne­jar via­gens. “A tec­no­lo­gia é mui­to impor­tan­te na avi­a­ção não ape­nas para a efi­ci­ên­cia e a segu­ran­ça de nos­sas ope­ra­ções, mas tam­bém para ofe­re­cer aos nos­sos pas­sa­gei­ros cada vez mais como­di­da­de e pro­ta­go­nis­mo ao con­tro­lar sua expe­ri­ên­cia de via­gem”, des­ta­ca Igor Miran­da, dire­tor de Ven­das e Mar­ke­ting da LATAM Air­li­nes Bra­sil.

PRÓ­XI­MA ETA­PA:
COM­PRAS POR VOZ

A segun­da onda de uso mas­si­fi­ca­do des­sa tec­no­lo­gia, segun­do Gar­ri­do, inclui a pos­si­bi­li­da­de de fazer com­pras a par­tir de alguns pou­cos coman­dos de voz de pro­du­tos via Ale­xa ou qual­quer outro assis­ten­te de voz. Seria a cha­ma­da “era tran­sa­ci­o­nal”.

No Bra­sil, o iFo­od seria a pri­mei­ra com­pa­nhia a ter uma skill tran­sa­ci­o­nal no País. “Anun­ci­a­mos em outu­bro a par­ce­ria com a Ama­zon, com o uso da Ale­xa, assis­ten­te vir­tu­al, para pos­si­bi­li­tar que os pedi­dos de deli­very pelo apli­ca­ti­vo sejam tam­bém fei­tos por coman­do de voz, tra­zen­do uma nova expe­ri­ên­cia na jor­na­da de deli­very pelo iFo­od. A incor­po­ra­ção des­sa tec­no­lo­gia é iné­di­ta e tor­na o iFo­od a úni­ca empre­sa de comi­da por entre­ga a uti­li­zá-la no País para pro­ces­sar pedi­dos”, dis­se Bru­no Pari­zot­to, head de Ino­va­ção do iFo­od.

Nos EUA, por exem­plo, diver­sas empre­sas já rea­li­zam tran­sa­ções por meio de um assis­ten­te de voz. Empre­sas como Domino’s, Uber, Star­bucks, entre outras, já per­mi­tem pedi­dos a par­tir de alguns coman­dos. A pró­pria Ama­zon uti­li­za a Ale­xa para ven­der alguns dos pro­du­tos em seu site – e isso tam­bém já está dis­po­ní­vel para o Bra­sil. No mer­ca­do ian­que, o volu­me de tran­sa­ções já seria de 9,6% dos con­su­mi­do­res que pos­su­em um robô falan­te para rea­li­zar com­pras, segun­do um estu­do pro­du­zi­do pela ope­ra­do­ra de paga­men­to Visa. Em 2018, esse per­cen­tu­al foi de 7,7%, o que sig­ni­fi­ca um cres­ci­men­to de 25% em ape­nas um ano.

HUMA­NI­ZA­ÇÃO E TAXA DE ERRO

Na ava­li­a­ção de espe­ci­a­lis­tas no assun­to, o Bra­sil tem poten­ci­al para alcan­çar essa era tran­sa­ci­o­nal e entrar de vez no jogo do rela­ci­o­na­men­to com o con­su­mi­dor tam­bém por esse canal. Antes, porém, a Ama­zon bra­si­lei­ra, as for­ne­ce­do­ras des­sa tec­no­lo­gia e as empre­sas que lidam dire­ta­men­te com o con­su­mi­dor pre­ci­sam aju­dar no desen­vol­vi­men­to do assis­ten­te de voz no Bra­sil. É pre­ci­so cri­ar um ecos­sis­te­ma ori­en­ta­do à con­tí­nua huma­ni­za­ção e ao apri­mo­ra­men­to des­ses robôs falan­tes.

É o que expli­ca, por exem­plo, Feli­pe de Almei­da, CEO e co-foun­der da Loud Voi­ce Ser­vi­ces, star­tup espe­ci­a­li­za­da no desen­vol­vi­men­to de expe­ri­ên­cia de voz huma­ni­za­da com inte­li­gên­cia arti­fi­ci­al. “Essa expe­ri­ên­cia pre­ci­sa ser mais huma­ni­za­da. Vozes estra­nhas e robó­ti­cas não são bem acei­tas por usuá­ri­os bra­si­lei­ros. Além dis­so, é pre­ci­so cons­truir um tim­bre de voz e um nível de qua­li­da­de de voz melhor, mui­to bem trei­na­do. Sem isso, tere­mos difi­cul­da­des na entra­da da tec­no­lo­gia no Bra­sil. Por outro lado, se fizer­mos o dever de casa, a cone­xão huma­na se tor­na mais fácil, o que faci­li­ta a inte­ra­ção e o apri­mo­ra­men­to do dese­nho da jor­na­da de rela­ci­o­na­men­to com voz. Se fizer­mos isso, eu tenho cer­te­za de que a tec­no­lo­gia vai ganhar rapi­da­men­te o mer­ca­do de rela­ci­o­na­men­to”, expli­ca Almei­da.

A Con­su­mi­dor Moder­no ques­ti­o­nou Feli­pe e outros espe­ci­a­lis­tas no assun­to sobre os prin­ci­pais gar­ga­los e os indi­ca­do­res que podem aju­dar as empre­sas no apri­mo­ra­men­to des­sas tec­no­lo­gi­as. Todos foram unâ­ni­mes em apon­tar o que eles cha­mam de “taxa de erro” ou o índi­ce que mede a quan­ti­da­de de res­pos­tas dadas pela máqui­na. “Esse é um indi­ca­dor impor­tan­tís­si­mo para o desen­vol­ve­dor de um assis­ten­te de voz. No entan­to, isso exi­ge mui­ta dis­ci­pli­na e um olhar con­tí­nuo da com­pa­nhia para eli­mi­nar erros e até adap­tar a fer­ra­men­ta para as cons­tan­tes mudan­ças no jei­to de as pes­so­as se comu­ni­ca­rem”, expli­ca Rodri­go Alves, con­sul­tor sêni­or de Solu­ções Digi­tais da Neob­po, empre­sa espe­ci­a­li­za­da na ges­tão de pro­ces­sos de negó­ci­os.

HOJE, 75% DAS DEMAN­DAS PODEM SER RESOL­VI­DAS POR UM ROBÔ SEM NENHU­MA PAR­TI­CI­PA­ÇÃO HUMA­NA

RODRI­GO ALVES, DA NEOB­PO

A Ama­zon, por exem­plo, leva tão a sério esse apri­mo­ra­men­to que pos­sui nada menos que 10 mil fun­ci­o­ná­ri­os no mun­do total­men­te dedi­ca­dos a tra­ba­lhar esses e outros gar­ga­los da Ale­xa. Afi­nal, para a empre­sa, a Ale­xa já é con­si­de­ra­da um dos canais de rela­ci­o­na­men­to da com­pa­nhia. Alves e outros espe­ci­a­lis­tas não têm dúvi­das de que os assis­ten­tes vão ocu­par esse espa­ço nas empre­sas.

Segun­do o con­sul­tor da Neob­po, 30% de todo o volu­me de uma área de aten­di­men­to pode­ria ser ocu­pa­do hoje por um robô falan­te ou via men­sa­gem por tex­to. Almei­da, da Loud Voi­ces, afir­ma que a tec­no­lo­gia tem outro poten­ci­al: redu­zir cus­tos por meio da auto­ma­ção de um con­tact cen­ter huma­no. “Quan­do a gen­te faz um busi­ness plan des­sa tec­no­lo­gia, veri­fi­ca­mos uma eco­no­mia de 70% sobre o mode­lo de aten­di­men­to con­ven­ci­o­nal. Hoje, 75% das deman­das podem ser resol­vi­das por um robô sem nenhu­ma par­ti­ci­pa­ção huma­na. Exis­te empre­sa com 45 mil cli­en­tes que pos­sui um assis­ten­te de voz e nove aten­den­tes huma­nos”, dis­se.

A Vivo, por exem­plo, ado­tou esse pro­ces­so de aná­li­se de erro dia­ri­a­men­te den­tro da Aura, e o resul­ta­do é ani­ma­dor. A robô falan­te per­mi­te pedir a segun­da via da con­ta, soli­ci­tar recar­ga, entre outros ser­vi­ços que podem ser aces­sa­dos no Goo­gle Assis­ten­te, no What­sApp e até mes­mo no SAC da empre­sa. “A Aura apre­sen­ta, apro­xi­ma­da­men­te, 90% de pre­ci­são, ou seja, ela com­pre­en­de cor­re­ta­men­te cer­ca de 90% das per­gun­tas de nos­sos cli­en­tes. Esta­mos em um nível de enten­di­men­to equi­va­len­te ao dos nos­sos aten­den­tes huma­nos. Em rela­ção a res­pon­der ade­qua­da­men­te, rea­li­za­mos pes­qui­sas com cli­en­tes para aper­fei­ço­a­men­to da expe­ri­ên­cia. É o futu­ro”, dis­se Fabri­cio Bin­di, dire­tor de Cus­to­mer Insights e Inte­li­gên­cia Arti­fi­ci­al da Vivo.

Outras empre­sas tam­bém já falam sobre o uso e o apri­mo­ra­men­to cons­tan­te da tec­no­lo­gia. De cer­ta for­ma, é como se as empre­sas esti­ves­sem ensi­nan­do as máqui­nas a rea­li­zar o mais orgâ­ni­co das for­mas de comu­ni­ca­ção: o bate-papo. Que as máqui­nas não come­tam alguns erros dos huma­nos; um deles é o mau aten­di­men­to.

CRI­A­MOS UMA TER­CEI­RA LÍN­GUA PARA A ALE­XA:
O INGLÊS BRA­SI­LEI­RO

No últi­mo dia 3 de outu­bro, a assis­ten­te de voz Ale­xa, da Ama­zon, deu iní­cio à sua tra­je­tó­ria no Bra­sil – e falan­do em por­tu­guês. Na lar­ga­da, ela foi lan­ça­da com, apro­xi­ma­da­men­te, 400 skills (ou gru­pos de coman­dos de voz) que vão des­de pedir um car­ro da Uber, com­prar comi­da pelo iFo­od ou até tocar uma músi­ca da Gali­nha Pin­ta­di­nha.

Esses coman­dos ape­nas pare­cem sim­ples, mas con­su­mi­ram nada menos que dez meses de tra­ba­lho, lem­bra Ricar­do Gar­ri­do, coun­try mana­ger da Ale­xa no Bra­sil. Um dos desa­fi­os foi adap­tar a manei­ra pecu­li­ar do bra­si­lei­ro em pro­nun­ci­ar pala­vras em inglês, tais como smartpho­ne ou e‑commerce. “A gen­te efe­ti­va­men­te cri­ou uma ter­cei­ra lín­gua den­tro da Ale­xa, que é o inglês bra­si­lei­ro. E a Ale­xa fala pala­vras com sota­que bra­si­lei­ro”, dis­se.

Con­su­mi­dor Moder­no – Pri­mei­ro, eu gos­ta­ria que o senhor expli­cas­se o que efe­ti­va­men­te é a Ale­xa?

Ricar­do Gar­ri­do — Toda tec­no­lo­gia nova traz uma nova inter­fa­ce. Então, vamos pen­sar nos últi­mos 40 anos. As pes­so­as par­ti­ram de uma máqui­na de escre­ver para um com­pu­ta­dor DOS e, por fim, para um PC com uma inter­fa­ce grá­fi­ca com mou­se. Depois, migra­mos para smartpho­nes com e sem tecla­do. Ago­ra, temos a Ale­xa e os ser­vi­ços de voz na nuvem. O pon­to prin­ci­pal é: che­ga­mos à mais orgâ­ni­ca das expe­ri­ên­ci­as com máqui­nas pos­sí­vel. Essa é a manei­ra de um usuá­rio come­çar a usar um ser­vi­ço sem pre­ci­sar de trei­na­men­to nenhum, ao con­trá­rio do que acon­te­ce com um smartpho­ne. Basi­ca­men­te, faze­mos uma per­gun­ta e o apa­re­lho ou o com­pu­ta­dor, de manei­ra infor­mal, lhe res­pon­de com infor­ma­ções sobre ciên­cia, con­ver­são de moe­da, uni­da­des de medi­da, resul­ta­do do time de fute­bol, pre­ço de pro­du­tos, com­prar coi­sas, ouvir músi­ca, ver fil­me etc. É um avan­ço gigan­tes­co para um pro­du­to que foi lan­ça­do há cin­co anos nos EUA. Des­de então, a Ale­xa tem sido um suces­so mai­or que a Ama­zon ima­gi­nou e, de fato, pegou a Ama­zon de sur­pre­sa. No momen­to, esta­mos fazen­do um pro­ces­so de inter­na­ci­o­na­li­za­ção dela, o que é um gran­de desa­fio. A cada país ou lín­gua nova, é como se esti­vés­se­mos lan­çan­do um pro­du­to novo. Nós real­men­te come­ça­mos um pro­du­to do zero a cada novo país. Então, nos últi­mos 20 meses, a Ama­zon saiu de qua­tro para 15 paí­ses pre­sen­tes. O Bra­sil é o mais recen­te deles.

CM – Quais foram os desa­fi­os da Ale­xa bra­si­lei­ra?

RGA gen­te lan­çou a Ale­xa com esco­po pra­ti­ca­men­te com­ple­to. O lan­ça­men­to da Ale­xa falan­do em por­tu­guês com cli­en­te bra­si­lei­ro foi mais com­ple­xo do que a ver­são lan­ça­da nos EUA há cin­co anos. Então, o esco­po de ser­vi­ços e coi­sas que a Ale­xa pode fazer no Bra­sil é pra­ti­ca­men­te o mes­mo que você encon­tra em qual­quer outro país, com a dife­ren­ça de que ela foi fei­ta para enten­der o bra­si­lei­ro de Nor­te a Sul, com todas as dife­ren­ças de sota­que, de voca­bu­lá­rio que exis­te e falan­do de uma manei­ra infor­mal com o bra­si­lei­ro. Essa é uma deci­são dife­ren­te que a empre­sa ado­tou em luga­res como a Espa­nha, a Fran­ça ou o Japão. Lá, a Ale­xa fala de uma manei­ra mais for­mal com o cli­en­te. Aqui, os cli­en­tes bra­si­lei­ros pre­fe­rem um tra­ta­men­to mais infor­mal.

CM – Pode­ria dar um exem­plo?

RGmanei­ra como se a gen­te con­ver­sas­se com outra pes­soa na rua, não neces­sa­ri­a­men­te seguin­do a gra­má­ti­ca for­mal. Ela, por exem­plo, vai dizer “hoje tá calor” em vez de “está calor”. Se per­gun­ta­mos sobre o pró­xi­mo jogo do Corinthi­ans, ela res­pon­de que o time joga con­tra o Inter­na­ci­o­nal “pelo Bra­si­lei­rão” em vez de “cam­pe­o­na­to bra­si­lei­ro”. Ela está pre­pa­ra­da para falar de uma manei­ra como as pes­so­as falam.

CM – Eu gos­ta­ria que o senhor falas­se sobre o desa­fio de pro­gra­mar a Ale­xa para a lín­gua por­tu­gue­sa.

RGTive­mos três gran­des desa­fi­os, lem­bran­do que a gen­te ficou trei­nan­do a Ale­xa em por­tu­guês des­de dezem­bro do ano pas­sa­do. Fica­mos dez meses aper­fei­ço­an­do o por­tu­guês dela. Nes­se sen­ti­do, o pri­mei­ro gran­de desa­fio foi pro­gra­mar o jei­to como o bra­si­lei­ro fala, enten­der exa­ta­men­te o sig­ni­fi­ca­do da pala­vra, o sota­que. Há pala­vras que têm sig­ni­fi­ca­dos dife­ren­tes no País todo. Você tem maca­xei­ra que é a mes­ma coi­sa que man­di­o­ca. Então, con­se­guir pegar o que uma pes­soa falou e fazer a Ale­xa enten­der foi o pri­mei­ro gran­de desa­fio. A gen­te tam­bém achou que o sota­que minei­ro pode­ria ser um pro­ble­ma pelo cos­tu­me de colo­car uma pala­vra sobre a outra ou omi­tir uma vogal no meio. Para a nos­sa sur­pre­sa, ela apren­deu mui­to rápi­do. O segun­do gran­de desa­fio é o con­tex­to da pala­vra que ela ouviu. O nome São Pau­lo, por exem­plo. Isso pode ser tan­to um time de fute­bol, uma cida­de, um Esta­do ou até um san­to. Então, colo­car isso em um con­tex­to foi um gran­de desa­fio. A saí­da foi esta­be­le­cer algu­mas regri­nhas. Se uma pes­soa fala “em São Pau­lo”, nor­mal­men­te ela está se refe­rin­do à cida­de. Quan­do ela fala “o São Pau­lo”, com o arti­go, ela quer saber sobre o time de fute­bol. A gen­te se saiu bem.

Por fim, o ter­cei­ro desa­fio é como a Ale­xa fala com as pes­so­as, o cha­ma­do “text spi­rit”. A Ale­xa apren­deu a falar por­tu­guês rela­ti­va­men­te bem e rápi­do. Daí a gen­te pas­sou a pres­tar aten­ção no jei­to como o bra­si­lei­ro fala pala­vras estran­gei­ras no dia a dia, como smartpho­ne ou e‑commerce. Nós, bra­si­lei­ros, fala­mos essas pala­vras não neces­sa­ri­a­men­te como elas são pro­nun­ci­a­das em inglês ou por um nati­vo da lín­gua ingle­sa. É o nos­so sota­que. Então, a gen­te per­ce­beu que seria impor­tan­te que a Ale­xa falas­se do jei­to como as pes­so­as falam essas pala­vras por aqui. Assim, des­de o iní­cio do ano, pro­cu­ra­mos desen­vol­ver uma manei­ra de a Ale­xa falar pala­vras em inglês de uma manei­ra mais colo­qui­al. Isso deu um tra­ba­lho extra mui­to gran­de. A gen­te efe­ti­va­men­te cri­ou uma ter­cei­ra lín­gua den­tro da Ale­xa, que é o inglês bra­si­lei­ro.

AS MILHA­RES DE HABI­LI­DA­DES DA AMA­ZON

O mais recen­te levan­ta­men­to fei­to pela Ama­zon no Bra­sil apon­ta para a exis­tên­cia de 400 skills ou habi­li­da­des fei­tas a par­tir do assis­ten­te de voz. Em outras pala­vras, isso sig­ni­fi­ca dizer que empre­sas, ins­ti­tui­ções e a pró­pria Ama­zon desen­vol­ve­ram habi­li­da­des que vão des­de pedir uma músi­ca, veri­fi­car o sal­do da con­ta-cor­ren­te ou até pedir um vídeo da Gali­nha Pin­ta­di­nha.

De acor­do com a Ama­zon, a Ale­xa pos­sui pou­co mais de 100 mil skills, o que repre­sen­ta o soma­tó­rio e todas as habi­li­da­des da assis­ten­te vir­tu­al espa­lha­das nos 15 paí­ses que rece­be­ram a assis­ten­te vir­tu­al.

Hoje, o recor­dis­ta de skills são os Esta­dos Uni­dos, com pou­co mais de 65 mil skills. Em segun­do lugar apa­re­ce o Rei­no Uni­do, com 34 mil, segui­do da Índia com, apro­xi­ma­da­men­te, 31 mil. Em quar­to lugar está o Cana­dá, com 25.423 skills, segui­do de Aus­trá­lia (24.173), Ale­ma­nha (9.792), Japão (2.989), Itá­lia (2.920) e Fran­ça (1.567)

SABE COM QUEM ESTÁ FALAN­DO?

O Bra­sil já con­ta com diver­sos assis­ten­tes de voz. Veja a lis­ta dos mais famo­sos, pre­sen­tes nos smartpho­nes e nos dis­po­si­ti­vos móveis

Cor­ta­na – Micro­soft
Ale­xa – Ama­zon
Bixby – Sam­sung
Assis­ten­te – Goo­gle
Siri – Apple

USOS NO BRA­SIL
Na bus­ca de pro­du­tos e faci­li­da­de no pro­ces­so de com­pra
Nos apa­re­lhos celu­la­res dos con­su­mi­do­res
Nas casas, atra­vés do con­tex­to de smart homes
No rela­ci­o­na­men­to dos vare­jis­tas com os con­su­mi­do­res

INDI­CA­DO­RES
Assim como acon­te­ce com qual­quer fer­ra­men­ta base­a­da em inte­li­gên­cia arti­fi­ci­al, é pre­ci­so cri­ar uma roti­na que con­sis­te em ciclo con­tí­nuo de medir e tes­tar a solu­ção.

 

Aná­li­se de flu­xo – é a veri­fi­ca­ção de como os usuá­ri­os estão uti­li­zan­do e se moven­do no canal de voz

Taxa de erro – é o per­cen­tu­al entre per­gun­tas fei­tas e res­pon­di­das. Apri­mo­rar esse indi­ca­dor é impor­tan­te para impe­dir a rein­ci­dên­cia de uma ques­tão sem res­pos­ta

Com­pa­ra­ção por seg­men­to – é o índi­ce que veri­fi­ca como os usuá­ri­os estão frag­men­tan­do as per­gun­tas den­tro da jor­na­da do assis­ten­te de voz. Isso aju­da a pre­ver futu­ras per­gun­tas den­tro de novas ver­ti­cais de dúvi­das dos con­su­mi­do­res

OS GAR­GA­LOS
Reco­nhe­ci­men­to de lin­gua­gem natu­ral
Enten­der o idi­o­ma, o con­tex­to, as carac­te­rís­ti­cas vocais e os sota­ques são alguns dos desa­fi­os do assis­ten­te de voz. Eis como cada um des­ses fato­res afe­ta o desen­vol­vi­men­to do robô que fala:

 

Idi­o­ma: é a veri­fi­ca­ção de como os usuá­ri­os estão uti­li­zan­do e se moven­do no canal de voz

Con­tex­to: difi­cul­da­de no pro­ces­sa­men­to de fra­ses lon­gas com múl­ti­plos comandos/questionamento den­tro de um con­tex­to com­ple­xo e de difí­cil inter­pre­ta­ção

Idi­o­ma: os dis­po­si­ti­vos inte­li­gen­tes ain­da estão apren­den­do a reco­nhe­cer as carac­te­rís­ti­cas vocais de uma pes­soa, bem como a cadên­cia e o sota­que

RUÍ­DOS SONO­ROS
Bai­xa pre­ci­são na inter­pre­ta­ção da voz a par­tir de ambi­en­tes com pes­so­as falan­do, tele­vi­são liga­da e infor­ma­ções no trân­si­to

SEGU­RAN­ÇA E PRI­VA­CI­DA­DE DOS DADOS
Assis­ten­tes de voz ain­da têm um lon­go cami­nho a per­cor­rer para redu­zir os recei­os dos con­su­mi­do­res em rela­ção à segu­ran­ça e à pri­va­ci­da­de de dados. Atu­al­men­te, os cli­en­tes não são capa­zes de ver o valor cri­a­do pelo com­par­ti­lha­men­to de seus dados e há des­con­fi­an­ça rela­ci­o­na­da à trans­pa­rên­cia no uso dos dados

Fon­tes: Ado­be Analy­tics e Logi­ca­lis