O que é “privacidade diferencial” e como ele mantém meus dados anônimos?
A Apple está apostando sua reputação em garantir que os dados que coleta de você permaneçam privados. Como? Usando algo chamado "Privacidade Diferencial".
O que é privacidade diferencial??
A Apple explica isso:
A Apple está usando a tecnologia de Privacidade Diferencial para ajudar a descobrir os padrões de uso de um grande número de usuários sem comprometer a privacidade individual. Para obscurecer a identidade de um indivíduo, a Privacidade Diferencial adiciona ruído matemático a uma pequena amostra do padrão de uso do indivíduo. À medida que mais pessoas compartilham o mesmo padrão, padrões gerais começam a surgir, o que pode informar e melhorar a experiência do usuário.
A filosofia por trás da Privacidade Diferencial é a seguinte: qualquer usuário cujo dispositivo, seja um iPhone, iPad ou Mac, adiciona um cálculo a um conjunto maior de dados agregados (uma grande figura formada a partir de imagens menores) não deve ser revelado como a fonte, e muito menos quais dados eles contribuíram.
A Apple não é a única empresa a fazê-lo, tanto o Google quanto a Microsoft o estavam usando ainda mais cedo. Mas a Apple popularizou falando sobre isso em detalhes na palestra de 2016 da WWDC.
Então, como isso é diferente de outros dados anônimos, você pergunta? Bem, dados anonimizados ainda podem ser usados para deduzir informações pessoais se você souber o suficiente sobre uma pessoa.
Digamos que um hacker possa acessar um banco de dados anônimo que revele a folha de pagamento de uma empresa. Digamos que eles também saibam que o funcionário X está se mudando para outra área. O hacker poderia simplesmente consultar o banco de dados antes e depois do Empregado X se mover e deduzir facilmente sua renda.
A fim de proteger as informações confidenciais do Funcionário X, a Privacidade Diferencial altera os dados com "ruído" matemático e outras técnicas de tal forma que, se você consultar o banco de dados, receberá apenas um aproximação de quanto (ou de qualquer outra pessoa) o funcionário X foi pago.
Portanto, sua privacidade é preservada devido à “diferença” entre os dados fornecidos e o ruído adicionado a ela, então é vago o suficiente para que seja virtualmente impossível saber se os dados que você está vendo são na verdade de um indivíduo em particular..
Como funciona a privacidade diferencial da Apple??
Privacidade Diferencial é um conceito relativamente novo, mas a ideia é que ele pode dar a uma empresa percepções baseadas em dados de seus usuários, sem saber o que exatamente que dados dizem ou de quem origina.
A Apple, por exemplo, depende de três componentes para fazer seu trabalho de Privacidade Diferencial no seu Mac ou dispositivo iOS: hashing, subamostragem e injeção de ruído.
Hashing pega uma string de texto e a transforma em um valor mais curto com um tamanho fixo e mistura essas chaves em seqüências aleatórias irreversíveis de caracteres únicos ou “hash”. Isso obscurece seus dados para que o dispositivo não armazene nada em sua forma original.
A subamostragem significa que, em vez de coletar todas as palavras digitadas por uma pessoa, a Apple usará apenas uma amostra menor delas. Por exemplo, digamos que você tenha uma longa conversa de texto com um amigo usando liberalmente emoji. Em vez de coletar toda a conversa, a subamostragem pode usar apenas as partes em que a Apple está interessada, como o emoji.
Por fim, seu dispositivo injeta ruído, adicionando dados aleatórios ao conjunto de dados original para torná-lo mais vago. Isso significa que a Apple obtém um resultado que tem sido mascarado um pouco e, portanto, não é exatamente exato.
Tudo isso acontece no seu dispositivo, então ele já foi encurtado, misturado, amostrado e desfocado antes mesmo de ser enviado para a nuvem para que a Apple analise.
Onde a privacidade diferencial da Apple é usada??
Há uma variedade de casos em que a Apple poderia deseja coletar dados para melhorar seus aplicativos e serviços. No momento, porém, a Apple está usando apenas a privacidade diferencial em quatro áreas específicas.
- Quando pessoas suficientes substituem uma palavra por um emoji específico, isso se tornará uma sugestão para todos.
- Quando novas palavras são adicionadas a dicionários locais suficientes para serem consideradas comuns, a Apple as adicionará ao dicionário de todos os demais também..
- Você pode usar um termo de pesquisa no Spotlight, e ele fornecerá sugestões de aplicativos e abrirá esse link no aplicativo ou permitirá que você o instale na App Store. Por exemplo, digamos que você pesquise "Star Trek", que sugere o aplicativo IMDB. Quanto mais pessoas abrirem ou instalarem o aplicativo do IMDB, mais ele aparecerá nos resultados de pesquisa de todos.
- Ele fornecerá resultados mais precisos para dicas de pesquisa no Notes. Por exemplo, digamos que você tenha uma nota com a palavra "maçã" nela. Você faz uma pesquisa de pesquisa e fornece resultados não apenas para a definição do dicionário, mas também para o site da Apple, os locais das Apple Stores e assim por diante. Presumivelmente, quanto mais pessoas tocarem em certos resultados, mais alto e com mais frequência eles aparecerão na pesquisa para todos os outros.
Vamos usar emojis como um exemplo. No iOS 10, a Apple introduziu um novo recurso de substituição de emojis no iMessage. Digite a palavra "amor" e você pode substituí-la por um emoji de coração. digite a palavra "cachorro", e você adivinhou, você pode substituí-lo com um emoji cachorro.
Da mesma forma, é possível que o seu iPhone preveja o que você quer que, se você estiver digitando a mensagem “Eu vou passear com ele”, o seu iPhone irá sugerir o emoji do cachorro..
Assim, a Apple pega todas as pequenas peças de dados do iMessage que coleta, examina-as como um todo e pode deduzir padrões do que as pessoas estão digitando e em que contexto. Isso significa que seu iPhone pode oferecer escolhas mais inteligentes, pois se beneficia de todas as conversas de texto que outras pessoas estão criando e pensa: "esse provavelmente é o emoticon que você deseja".
Leva uma Aldeia (de Emoji)
A desvantagem da privacidade diferencial é que ela não fornece resultados precisos em pequenas amostras. Seu poder está em tornar dados específicos vagos, de modo que não possam ser atribuídos a nenhum usuário. Para que funcione e funcione bem, muitos usuários devem participar.
É como olhar para uma foto de bitmap extremamente próxima. Você não será capaz de ver o que é se olhar apenas alguns bits, mas quando você dá um passo para trás e olha para a coisa toda, a imagem se torna mais clara e definida, mesmo que não seja muito alta. resolução.
Assim, a fim de melhorar a substituição e previsão de emojis (entre outras coisas), a Apple precisa coletar dados do iPhone e Mac de todo o mundo para dar uma imagem cada vez mais clara do que as pessoas estão fazendo e assim melhorar seus aplicativos e serviços. Ele se transforma em todos esses dados aleatórios, barulhentos e crowdsourced, e os analisa para padrões, como quantos usuários estão usando o emoji de pêssego no lugar de "bunda".
Assim, o poder da Privacidade Diferencial depende da capacidade da Apple de examinar grandes quantidades de dados agregados, garantindo ao mesmo tempo que não é mais sábio saber quem os está enviando..
Como desativar a privacidade diferencial no iOS e no macOS
Se você ainda não está convencido de que a Privacidade Diferencial é a certa para você, você está com sorte. Você pode optar por sair diretamente das configurações do seu dispositivo.
No seu dispositivo iOS, toque em "Configurações" e depois em "Privacidade".
Na tela Privacidade, toque em "Diagnóstico e uso".
Por fim, na tela Diagnóstico e uso, toque em "Não enviar".
No macOS, abra as Preferências do Sistema e clique em “Segurança e Privacidade”.
Nas preferências de Segurança e Privacidade, clique na guia "Privacidade" e verifique se "Enviar dados de diagnóstico e uso para a Apple" está desmarcado. Observe que você precisará clicar no ícone de cadeado no canto inferior esquerdo e digitar sua senha do sistema antes de poder fazer essa alteração.
Obviamente, há muito mais para a privacidade diferencial, tanto na teoria quanto na aplicação, do que essa explicação simplificada. A carne e batatas dependem fortemente de algumas matemáticas sérias e, como tal, podem ficar bastante pesadas e complicadas.
Espero, no entanto, que isso lhe dê uma idéia de como isso funciona e que você se sinta mais confiante sobre as empresas que coletam determinados dados sem medo de serem identificados.