banner

blog

Aug 04, 2023

Com uma pequena ajuda de tubos de PVC, pesquisadores de Wisconsin enganam alguns sistemas de identificação de voz

É possível enganar sistemas de computador que usam a voz de uma pessoa como senha? Alguns engenheiros de Wisconsin dizem que a resposta é sim, e que o fizeram em parte usando tubos de plástico que você pode encontrar em uma loja de ferragens.

Alguns sistemas bancários on-line usam a identificação automática do locutor – em termos mais simples – a voz do titular da conta como senha. Kassem Fawaz, engenheiro elétrico e de computação da UW-Madison, diz que também os usuários do Apple iPhone provavelmente estão familiarizados com o assistente virtual Siri, que responde apenas ao proprietário.

“A razão pela qual a Siri só responde a você é porque eles empregam uma tecnologia chamada identificação de alto-falante. Assim, eles obtêm algum tipo de impressão de voz, que é semelhante a uma impressão digital, e podem verificar se veio de você ou de outra pessoa. E é assim que a Siri pode garantir que o usuário ou proprietário do telefone esteja falando com ele”, diz Fawaz.

Mas Fawaz e dois Ph.D. da UW-Madison. os alunos fazem parte de um esforço multiuniversitário para melhorar a segurança digital. E assim, eles têm procurado maneiras de enganar os sistemas de computador. Eles e outros já estão trabalhando na clonagem da voz humana e em fazer com que um computador fale como essa pessoa.

Mais recentemente, Fawaz diz que os engenheiros perceberam que poderiam voltar do digital para o analógico para enganar muitos sistemas de identificação de alto-falantes.

“E foi assim que tivemos a ideia de projetar algum tipo de dispositivo analógico que não possui nenhum tipo de eletrônica digital que permita personificar outras pessoas”, diz Fawaz.

Ph.D. a estudante Shimaa Ahmed diz que primeiro tentou falar através do tubo de papelão encontrado em muitos rolos de papel toalha, imitando celebridades.

"E funcionou. Quando passei algumas vozes de celebridades por este tubo de papel toalha de cozinha, mudei a previsão dessas celebridades", diz Ahmed.

Por fim, Fawaz comprou alguns tubos de plástico de PVC no corredor de peças de encanamento de uma loja de ferragens e a equipe começou a usá-los.

Fawaz diz que perceberam que os tubos tinham deficiências.

"Tubos de encanamento normais têm dimensões fixas, certo? Você pode controlar o comprimento cortando-o. Mas não pode controlar o diâmetro. Para alguns experimentos, precisávamos de tubos com um diâmetro especial, que você não encontra na Ace Hardware . Então, o que precisávamos fazer era fabricar esses tubos, e a maneira mais fácil de fabricá-los é imprimi-los em 3D", diz Fawaz.

A equipe recorreu ao então estudante de graduação, agora Ph.D. estudante, Yash Wani, que imprimiu alguns tubos em 3D. Wani diz que o trabalho mudou seu foco acadêmico.

“Foi muito legal, honestamente, ter sido assim que acabei fazendo um doutorado. Foi legal o suficiente para eu continuar fazendo isso”, diz ele.

Os pesquisadores desenvolveram um algoritmo, ou instruções rigorosas, que calculavam as dimensões do tubo necessárias para transformar a ressonância – isto é, intensidade e qualidade do tom – de quase qualquer voz para imitar outra.

Em uma gravação, Ahmed leu um conjunto de dados de fala convencional e parecia um pouco com a atriz Lisa Kudrow – você sabe, Phoebe de Friends.

“Não havia nada na rocha”, dizia a leitura. Ahmed também tentou imitar a atriz Kelly Reilly, da série de TV Yellowstone. “'Não tenho ideia', respondeu Phillip”, disse Ahmed na gravação.

Não eram imitações exatas. Mas eles foram bons o suficiente para passar pelos filtros de ataque digital de um sistema de autenticação de voz e enganá-lo. Também usando vozes de outros estudantes em seu experimento, os engenheiros da UW-Madison relatam enganar os sistemas de segurança 60% das vezes em um teste de 91 vozes.

Bom o suficiente para escrever um artigo e para Ahmed apresentar as conclusões num simpósio de segurança este mês na Califórnia.

“As pessoas ficaram curiosas para saber como podemos fazer dispositivos como tubos, mas mais complicados, que podemos personificar qualquer pessoa”, diz Ahmed.

Fawaz diz que todos os fabricantes de sistemas de identificação de alto-falantes – Apple, Google, IBM, Microsoft e outros – estão cientes das diversas deficiências de sua tecnologia e estão tentando corrigi-las.

COMPARTILHAR