Fatos principais
- Categoria
- Text Processing
- Tipos de entrada
- textarea, select, checkbox
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Normalizador de Texto Falso é uma ferramenta eficiente projetada para limpar textos que contêm caracteres enganosos, homoglifos ou símbolos invisíveis, convertendo-os em texto legível e padrão.
Quando usar
- •Ao identificar textos copiados da web que contêm caracteres estranhos ou ilegíveis.
- •Para limpar dados de entrada que utilizam homoglifos para contornar filtros de segurança.
- •Ao preparar documentos para processamento onde caracteres Unicode invisíveis causam erros de formatação.
Como funciona
- •Cole o texto contendo caracteres suspeitos ou falsos na área de entrada.
- •Selecione o modo de limpeza desejado, como 'Homoglyph Normalization' ou 'Aggressive Cleanup'.
- •Ative opções adicionais como a remoção de caracteres invisíveis ou normalização de espaços.
- •Clique em processar para obter o texto limpo e pronto para uso.
Casos de uso
Exemplos
1. Limpeza de dados de formulário
Desenvolvedor Web- Contexto
- Usuários enviam nomes de usuário contendo caracteres invisíveis que quebram o banco de dados.
- Problema
- Caracteres Unicode invisíveis estão causando erros de validação no sistema.
- Como usar
- Cole o nome do usuário no campo de entrada e ative 'Remover Caracteres Unicode Invisíveis'.
- Resultado
- O texto é limpo, removendo os caracteres ocultos e permitindo o armazenamento correto no banco de dados.
2. Normalização de texto ofuscado
Analista de Segurança- Contexto
- Um e-mail de phishing utiliza homoglifos para simular um link legítimo.
- Problema
- O texto contém caracteres que parecem letras latinas, mas são símbolos diferentes.
- Como usar
- Insira o texto suspeito e selecione 'Homoglyph Normalization Only'.
- Resultado
- Os caracteres enganosos são convertidos para seus equivalentes padrão, revelando o texto real por trás da ofuscação.
Testar com amostras
image, video, textHubs relacionados
FAQ
O que são homoglifos?
São caracteres que parecem visualmente idênticos ou muito semelhantes a outros, mas possuem códigos Unicode diferentes, frequentemente usados para disfarçar palavras.
A ferramenta remove espaços extras?
Sim, ao ativar a opção 'Normalizar Caracteres de Espaço em Branco', a ferramenta ajusta espaços irregulares para o padrão.
O que acontece com caracteres que a ferramenta não reconhece?
Se a opção 'Preservar Caracteres Desconhecidos' estiver marcada, esses caracteres serão mantidos intactos no texto final.
É seguro usar esta ferramenta com dados sensíveis?
O processamento é feito localmente no seu navegador, garantindo que seu texto não seja enviado para servidores externos.
Qual a diferença entre o modo Homoglyph e o Agressivo?
O modo Homoglyph foca apenas na substituição de caracteres visuais, enquanto o modo Agressivo aplica todas as técnicas de limpeza disponíveis simultaneamente.