22 Junho 2021 19:19

Desanonimização

O que é desanonimização?

A desanonimização é uma técnica usada na mineração de dados que tenta reidentificar informações criptografadas ou obscurecidas. A desanonimização, também conhecida como reidentificação de dados, faz referência cruzada de informações anônimas com outros dados disponíveis para identificar uma pessoa, grupo ou transação. 

Principais vantagens

  • A anonimização é a prática de reconstituir as informações privadas armazenadas em dados criptografados ou obscurecidos de outra forma.
  • Dados anônimos são usados ​​de forma onipresente em transações on-line e financeiras, bem como em mídias sociais e outras formas de comunicação e mensagens eletrônicas.
  • A reidentificação de dados anônimos pode comprometer a identidade pessoal e a segurança financeira para fins ilegais, bem como minar a confiança do consumidor.

Compreendendo a desanonimização

A era do conhecimento de tecnologia está rapidamente perturbando a maneira tradicional de fazer as coisas em vários setores da economia. Nos últimos anos, o setor financeiro viu muitos produtos digitais introduzidos em seu setor por empresas de fintech. Esses produtos inovadores promoveram a inclusão financeira, por meio da qual mais consumidores têm acesso a produtos e serviços financeiros a um custo menor do que o permitido pelas instituições financeiras tradicionais. O aumento na implementação de tecnologia trouxe um aumento na coleta, armazenamento e uso de dados.

Ferramentas de tecnologia como plataformas de mídia social, plataformas de pagamento digital e tecnologia de smartphone revelaram uma tonelada de dados usados ​​por várias empresas para aprimorar sua interação com os consumidores. Essa tonelada de dados é chamada de big data e é motivo de preocupação entre indivíduos e autoridades regulatórias que exigem mais leis que protejam a identidade e a privacidade dos usuários.

Como funciona a desanonimização

Na era do big data, em que informações confidenciais sobre as atividades online de um usuário são compartilhadas instantaneamente por meio da computação em nuvem, ferramentas de anonimização de dados têm sido empregadas para proteger as identidades dos usuários. O anonimato mascara as informações de identificação pessoal (PII) de usuários que fazem transações em vários campos, como serviços de saúde, plataformas de mídia social, transações de comércio eletrônico, etc. PII incluem informações como data de nascimento, número de segurança social (SSN), código postal e IP Morada. A necessidade de mascarar os rastros digitais deixados pelas atividades online levou à implementação de estratégias de anonimato, como criptografia, exclusão, generalização e perturbação. Embora os cientistas de dados usem essas estratégias para separar informações confidenciais dos dados compartilhados, eles ainda preservam as informações originais, abrindo portas para a possibilidade de reidentificação.

A desanonimização reverte o processo de anonimato, combinando conjuntos de dados compartilhados, mas limitados, com conjuntos de dados que são facilmente acessíveis online. Os mineradores de dados podem então recuperar algumas informações de cada conjunto de dados disponível para reunir a identidade ou transação de uma pessoa. Por exemplo, um minerador de dados pode recuperar um conjunto de dados compartilhado por uma empresa de telecomunicações, um site de mídia social, uma plataforma de e-commerce e um resultado do censo disponível publicamente para determinar o nome e as atividades frequentes de um usuário.

Como a desanonimização é usada

A reidentificação pode ser bem-sucedida quando novas informações são divulgadas ou quando a estratégia de anonimato implementada não é feita de maneira adequada. Com um vasto suprimento de dados e quantidade limitada de tempo disponível por dia, analistas de dados e mineradores estão implementando atalhos conhecidos como heurísticas na tomada de decisões. Embora a heurística economize tempo e recursos valiosos ao vasculhar um conjunto de dados, ela também pode criar lacunas que podem ser aproveitadas se a ferramenta heurística errada for implementada. Essas lacunas podem ser identificadas por mineradores de dados que buscam desanimar um conjunto de dados para fins legais ou ilegais.

As informações de identificação pessoal obtidas ilegalmente por meio de técnicas de anonimato podem ser vendidas em mercados clandestinos, que também são uma forma de plataformas de anonimato. As informações que caem em mãos erradas podem ser usadas para coerção, extorsão e intimidação, levando a preocupações com a privacidade e custos enormes para as empresas que são vítimas.

A anonimização também pode ser usada legalmente. Por exemplo, osite Silk Road, um mercado clandestino de drogas ilegais, era hospedado por uma rede anônima chamada Tor, que usa uma estratégia cebola para ofuscar os endereços IP de seus usuários. A rede Tor também hospeda alguns outros mercados ilegais de comércio de armas, cartões de crédito roubados e informações corporativas confidenciais. Com o uso de ferramentas complexas de anonimato, o FBI decifrou e fechou o Silk Road e sites de pornografia infantil.

O sucesso nos processos de reidentificação provou que o anonimato não é garantido. Mesmo que ferramentas de anonimização inovadoras fossem implementadas hoje para mascarar dados, os dados poderiam ser reidentificados em alguns anos, à medida que novas tecnologias e novos conjuntos de dados se tornassem disponíveis.