Podemos afirmar, sem qualquer sombra de dúvida, que você já se deparou com Captchas em algum momento das suas atividades na internet.
Aliás, podemos ir mais além: você lida com Captchas frequentemente, ainda que às vezes isso não seja sequer comunicado a você de maneira direta.
Mas você sabe o que é um Captcha? Como essa tecnologia foi criada e porque ela se tornou tão onipresente nos dias de hoje?
Descubra as respostas para essas perguntas, e muitas outras, neste artigo.
A palavra Captcha é, na verdade, um acrônimo. Em inglês, ela significa “Completely Automated Public Turing test to tell Computers and Humans Apart”, o que traduz-se para “Teste Turing público completamente automatizado para diferenciar computadores e humanos”.
Ou seja, é uma ferramenta que tem como objetivo identificar se quem está visitando um determinado site é um humano ou um bot. Se o teste comprovar que o visitante é humano, a entrada é liberada.
Se, por outro lado, o teste identificar que a solicitação vem de um robô, o acesso ao site é imediatamente bloqueado.
Um ponto importante: é falso afirmar que todo uso de bot é malicioso. A verdade é bem diferente disso.
A coleta automatizada de dados, realizada por bots chamados de web crawlers, é um desses usos legítimos. A coleta de dados é parte importante do mercado global de big data que deve alcançar uma valorização de 70 bilhões de dólares até o final de 2022.
Com essa informação em mente, o Captcha está lá para proteger a informação e por vezes diminuir a necessidade de maiores recursos computacionais para manter servidores, uma vez que o tráfego automatizado será reduzido.
Conforme explicamos acima, o Captcha funciona de maneira a impedir o uso de bots em sites, mesmo que esses usos sejam legítimos e respaldados pela lei.
Algumas das ameaças mais comuns que o Captcha combate são:
É muito comum, hoje em dia, que sites possuam sistemas em ação para determinar se a origem de uma visita é de um humano ou de um bot.
Caso esses sistemas identifiquem alguma atividade suspeita da parte do usuário, um teste Captcha é imediatamente apresentado para que a suspeita seja sanada. Todo esse processo, por vezes, é completamente invisível ao usuário, conforme veremos mais adiante.
Não existe um só tipo de Captcha. Existem tantos, na verdade, que selecionamos para você os que são mais utilizados atualmente e como cada um deles funciona.
Lançado em 2007 e criado pelo cientista da computação Luis von Ahn em conjunto com outros desenvolvedores, o reCAPTCHA funcionava, inicialmente, por meio da transcrição de palavras apresentadas de maneira distorcida ou riscada.
O reCAPTCHA foi adquirido pelo Google em 2009 e, logo em seguida, algumas importantes mudanças foram feitas.
A primeira grande mudança após a aquisição aconteceu em 2012. Ainda em sua primeira versão, o reCAPTCHA passou a apresentar, além de palavras, imagens retiradas do Google Street View.
A segunda versão do reCAPTCHA, chamada de No CAPTCHA reCAPTCHA, veio em 2013. Foi o início do processo, da parte do Google, de identificar bots por meio da análise comportamental do usuário.
Um dos pontos positivos dessa versão, para usuários, é que se a ferramenta identificá-los como “baixo risco”, tudo que ele precisa fazer é marcar uma caixinha confirmando que não é um robô.
Em 2017, com os avanços do Google no campo da análise comportamental permitiu o surgimento do reCAPTCHA “invisível”, que funciona 100% nos bastidores e que não exige nenhuma ação da parte do usuário.
Muito embora o Captcha tenha sido criado para evitar atividades maliciosas, a verdade é que existem sim razões perfeitamente legais para contornar esse tipo de teste.
Soluções que envolvem Inteligência Artificial têm se mostrado cada vez mais eficazes quando o assunto é contornar ou solucionar Captchas de maneira automatizada.
É possível, por exemplo, fazer uso de Machine Learning (Aprendizado de Máquina) ou de redes neurais artificiais para resolver Captchas em texto ou em imagens, dois dos tipos mais comuns de testes.
Outra solução é a personificação de navegadores.
Há, ainda, empresas especializadas no fornecimento de serviços voltados para a quebra de Captchas, conforme veremos no próximo tópico.
Confira, agora, uma lista com alguns dos principais fornecedores de quebra de Captcha atualmente.
Agora que você já expandiu os seus conhecimentos sobre Captcha e compreendeu a importância de soluções de quebra de Captcha para que a coleta automatizada de dados aconteça sem gargalos, que tal dar o próximo passo?
Aqui na Crawly, desenvolvemos tecnologia de ponta para coleta automatizada e em tempo real de dados em sites de e-commerce, dados de veículos, imobiliários, de portais públicos e muito mais.