Pagina inicial » como » Alexa, Siri e Google não entendem uma palavra que você diz

    Alexa, Siri e Google não entendem uma palavra que você diz

    Amazon

    Assistentes de voz como Alexa, Google Assistant e Siri percorreram um longo caminho nos últimos anos. Mas, apesar de todas as melhorias, uma coisa as impede: elas não entendem você. Eles confiam demais em comandos de voz específicos.

    Reconhecimento de fala é apenas um truque de mágica

    Amazon

    Assistentes de voz não entendem você. Na verdade não, de qualquer maneira. Quando você fala com um Google Home ou o Amazon Echo, ele basicamente converte suas palavras em uma string de texto e as compara aos comandos esperados. Se encontrar uma correspondência exata, segue um conjunto de instruções. Se isso não acontecer, ele procura uma alternativa do que fazer com base nas informações que possui e, se isso não funcionar, você recebe uma mensagem de falha como “Sinto muito, mas não sei . "É pouco mais do que mágica de truque para enganar você e pensar que entende.

    Ele não pode usar pistas contextuais para fazer o melhor palpite, ou mesmo usar um entendimento de tópicos semelhantes para informar suas decisões. Também não é difícil enganar os assistentes de voz. Enquanto você pode perguntar a Alexa “Você trabalha para a NSA?” E obter uma resposta, se você perguntar “Você faz secretamente parte da NSA?”, Você recebe uma resposta “Eu não conheço essa” (pelo menos na momento da redação deste artigo).

    Humanos, que entendem genuinamente a fala, não funcionam assim. Suponha que você pergunte a um humano: “O que é esse klarvain no céu? Aquela que é arqueada, e cheia de cores listradas como vermelho, laranja, amarelo e azul. ”Apesar de klarvain ser uma palavra inventada, a pessoa que você perguntou provavelmente poderia descobrir a partir do contexto que você está descrevendo um arco-íris..

    Enquanto você poderia argumentar que um humano está convertendo a fala em idéias, um humano pode então aplicar conhecimento e compreensão para concluir uma resposta. Se você perguntar a um humano se secretamente trabalha para a NSA, ele lhe dará uma resposta sim ou não, mesmo que essa resposta seja uma mentira. Um humano não diria "eu não conheço esse" para uma pergunta como essa. Que os humanos podem mentir é algo que vem com uma compreensão real.

    Assistentes de voz não podem ir além de sua programação

    Os assistentes de voz limitam-se, em última instância, aos parâmetros esperados programados, e vagar fora deles interromperá o processo. Esse fato é exibido quando dispositivos de terceiros chegam para jogar. Geralmente, o comando para interagir com eles é muito complicado, chegando a dizer ao fabricante do dispositivo para comandar o argumento opcional. Um exemplo exato seria: "Diga à Whirlpool para pausar a secadora". Para um exemplo ainda mais difícil de lembrar, o Geneva Alexa habilidade controla alguns fornos GE. Um usuário da habilidade precisa lembrar de “dizer a Genebra” e não “contar à GE”, então o resto do comando. E enquanto você pode pedir para pré-aquecer o forno a 350 graus, você não pode seguir com um pedido para aumentar a temperatura em outros 50 graus. Um humano poderia seguir estes pedidos embora.

    Amazon e Google têm trabalhado arduamente para superar esses obstáculos, e isso mostra. Onde uma vez você teve que seguir a seqüência acima para controlar uma trava inteligente, agora você pode dizer “trancar a porta da frente”. Alexa costumava ser confundida por “conte-me uma piada de cachorro”, mas peça uma hoje e ela funcionará. Eles adicionaram variações aos comandos que você usa, mas no final você ainda precisa saber o comando certo a ser dito. Você precisa usar a sintaxe correta, na ordem correta.

    E se você acha que parece muito com uma linha de comando, você não está errado.

    Assistentes de voz são uma linha de comando extravagante

    Uma linha de comando é definida de forma restrita para executar tarefas simples, mas somente se você souber a sintaxe adequada. Se você sair dessa sintaxe correta e digitar dyr em vez de dir, o prompt de comando fornecerá uma mensagem de erro. Você pode usar aliases para obter comandos mais fáceis de lembrar, mas é necessário ter uma ideia de quais eram os comandos originais, como eles funcionam e como usar aliases com eficiência. Se você não tomar o tempo para aprender os ins e fora da linha de comando, você nunca terá muito a ver com isso.

    Assistentes de voz não são diferentes. Você precisa saber a maneira correta de dizer um comando ou fazer uma pergunta. E você precisa saber como configurar grupos para o Google e o Alexa, por que agrupar seus dispositivos é essencial e como nomear seus dispositivos inteligentes. Se você não seguir esses passos necessários, sentirá a frustração de pedir ao seu assistente de voz para desligar o estudo, apenas para ser perguntado, “qual estudo” deve ser desativado..

    Mesmo quando você usa a sintaxe correta na ordem correta, o processo pode falhar. Ou com a resposta errada emitida ou um resultado surpreendente. Duas Casas do Google na mesma casa podem oferecer condições meteorológicas para locais um pouco diferentes, mesmo que tenham acesso às mesmas informações da conta de usuário e à conexão com a Internet.

    No exemplo acima, o comando “Set a timer for half hour” é dado. O hub inicial do Google criou um cronômetro chamado "Hora" e perguntou por quanto tempo o cronômetro deveria ser. E ainda repetindo o mesmo comando três outras vezes funcionou corretamente e criou um temporizador de 30 minutos. Usando o comando "Definir um timer por 30 minutos" funciona corretamente em uma base mais consistente.

    Embora a conversa com um Google Home ou Echo possa ser mais fluida, os assistentes de voz e as linhas de comando funcionam da mesma maneira. Você pode não precisar aprender um novo idioma, mas precisa aprender um novo dialeto.

    A compreensão estreita dos assistentes de voz limitará o crescimento

    Nada disso impede que assistentes de voz como Google Assistant e Alexa trabalhem bem o suficiente (embora Cortana seja uma história diferente). Google Assistant e Alexa e pesquise on-line em busca de perguntas com decência, embora não surpreenda que o Google seja melhor na pesquisa e possa responder a perguntas básicas como conversões de medição e matemática simples. Com uma casa inteligente configurada corretamente e um usuário bem treinado, a maioria dos comandos domésticos inteligentes funcionará como pretendido. Mas isso veio através do trabalho e esforço, não a compreensão intelectual.

    Timers e Alarms costumavam ser simplistas. Ao longo do tempo, a nomeação foi adicionada e, em seguida, a capacidade de adicionar tempo a um timer. Eles mudaram de simplista para mais complicado. Os assistentes de voz podem responder a mais perguntas e cada dia traz novas habilidades e recursos. Mas isso não é um produto de auto-crescimento que vem da aprendizagem e compreensão.

    E nada disso fornece a capacidade inerente de usar o que é conhecido por alcançar o desconhecido. Para cada comando e pergunta que funciona, sempre haverá três que não funcionam. Sem um avanço em A.I. que concede uma capacidade humana de compreensão, os assistentes de voz não são assistentes de todo. São apenas linhas de comando de voz - úteis no cenário certo, mas limitadas aos cenários que foram programados para entender.

    Em outras palavras: máquinas estão aprendendo coisas, mas não podem entendê-las.