Fatos principais
- Categoria
- Conversão e codificação
- Tipos de entrada
- textarea, select, checkbox
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Conversor de Escape Unicode permite converter facilmente textos para sequências de escape Unicode (como \uXXXX ou \u{XXXXXX}) e vice-versa, além de aplicar normalizações de texto (NFC, NFD, NFKC, NFKD) para garantir a consistência de caracteres especiais e símbolos em seus projetos de desenvolvimento.
Quando usar
- •Ao programar em linguagens que exigem a representação de caracteres não-ASCII por meio de sequências de escape como \uXXXX ou \u{XXXXXX}.
- •Ao depurar problemas de codificação de caracteres ou inconsistências de fontes em bancos de dados e arquivos de configuração.
- •Ao precisar normalizar strings usando NFC ou NFD para garantir que caracteres acentuados compostos ou decompostos sejam comparados corretamente.
Como funciona
- •Insira o texto original ou a sequência de escape Unicode no campo de entrada de texto.
- •Selecione a operação desejada: converter texto para escape, converter escape para texto ou aplicar normalização Unicode.
- •Configure as opções adicionais, como o estilo de escape (por exemplo, ES6 \u{XXXXXX} ou pontos de código Hex) e se deseja escapar apenas caracteres não-ASCII.
- •O resultado convertido ou normalizado é gerado instantaneamente na tela para cópia.
Casos de uso
Exemplos
1. Preparação de Strings para Código JavaScript
Desenvolvedor Frontend- Contexto
- Um desenvolvedor precisa incluir caracteres especiais e emojis em uma string JavaScript sem causar problemas de codificação no arquivo de script.
- Problema
- Garantir que caracteres especiais como 'café' e emojis sejam representados de forma segura usando o formato de escape ES6.
- Como usar
- Insira o texto no campo de entrada, selecione a operação 'Texto para Escape \u', escolha o estilo '\u{XXXXXX} (ponto de código ES6)' e ative a opção 'Escapar Apenas Não-ASCII'.
- Configuração de exemplo
-
Operação: escape, Estilo de Escape: u{XXXXXX}, Escapar Apenas Não-ASCII: true - Resultado
- O texto 'café ☕' é convertido para 'caf\u{e9} \u{2615}', mantendo os caracteres ASCII intactos e escapando os especiais de forma segura.
2. Normalização de Nomes com Acentos para Banco de Dados
Engenheiro de Dados- Contexto
- O engenheiro está recebendo dados de diferentes fontes onde a palavra 'maçã' está codificada de formas diferentes (algumas com 'ç' composto e outras com 'c' + cedilha combinada).
- Problema
- Padronizar todas as strings para evitar duplicidade e erros de busca no banco de dados.
- Como usar
- Insira a lista de palavras no campo de entrada, selecione a operação 'Normalização Unicode' e escolha a forma de normalização 'NFC (Composição Canônica)'.
- Configuração de exemplo
-
Operação: normalize, Forma de Normalização: NFC - Resultado
- Todas as strings são convertidas para a forma canônica composta (NFC), garantindo consistência na indexação e busca.
Testar com amostras
image, textHubs relacionados
FAQ
O que faz a opção 'Escapar Apenas Não-ASCII'?
Ela mantém os caracteres ASCII padrão legíveis e converte apenas caracteres especiais, acentos e emojis em sequências de escape.
Qual é a diferença entre NFC e NFD na normalização?
O NFC combina caracteres decompostos em um único caractere pré-composto, enquanto o NFD separa caracteres acentuados em seus componentes individuais.
O conversor suporta o formato de ponto de código do ES6?
Sim, você pode selecionar o estilo de escape \u{XXXXXX} que é compatível com o padrão ECMAScript 6.
Como posso converter sequências de escape de volta para texto legível?
Selecione a operação 'Escape \u para Texto', insira as sequências de escape no campo de entrada e o texto original será exibido.
O que são pares substitutos (surrogate pairs)?
São pares de valores de 16 bits usados para representar caracteres fora do Plano Multilíngue Básico (BMP), como alguns emojis, no formato \uXXXX\uXXXX.