Fatos principais
- Categoria
- Data Processing
- Tipos de entrada
- textarea, select, checkbox
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Removedor de Caracteres BOM é uma ferramenta essencial para limpar arquivos de texto e dados que contêm o Byte Order Mark (BOM), um caractere invisível que frequentemente causa erros de codificação em sistemas, importações de CSV e processamento de scripts.
Quando usar
- •Quando arquivos CSV ou de texto falham ao serem importados em bancos de dados ou planilhas devido a caracteres estranhos no início.
- •Ao encontrar erros de sintaxe em arquivos de configuração ou scripts que parecem corretos, mas não são executados.
- •Para padronizar a codificação de arquivos de texto antes de enviá-los para APIs ou sistemas de processamento de dados.
Como funciona
- •Cole o conteúdo do seu texto na área de entrada ou carregue o arquivo correspondente.
- •Selecione o modo de detecção desejado, como 'Remover Todos os Tipos de BOM' para uma limpeza abrangente.
- •Escolha o formato de saída, como 'Apenas Texto Limpo', para obter o conteúdo pronto para uso imediato.
- •Clique no botão de processar para remover os caracteres invisíveis e visualizar o resultado limpo.
Casos de uso
Exemplos
1. Limpeza de CSV para Importação
Analista de Dados- Contexto
- Um arquivo CSV exportado de um sistema legado não estava sendo reconhecido corretamente pelo software de BI, exibindo caracteres estranhos na primeira coluna.
- Problema
- O arquivo continha um BOM UTF-8 que corrompia o cabeçalho da primeira coluna.
- Como usar
- Colei o conteúdo do CSV na ferramenta, selecionei 'Remover Apenas BOM UTF-8' e escolhi 'Apenas Texto Limpo'.
- Resultado
- O arquivo resultante foi importado sem erros, com os cabeçalhos reconhecidos perfeitamente pelo software de BI.
2. Reparo de Arquivo de Configuração JSON
Desenvolvedor Web- Contexto
- Um arquivo de configuração JSON estava gerando um erro de 'Unexpected token' ao ser lido por um script Node.js, apesar de o conteúdo parecer correto.
- Problema
- O arquivo foi salvo com BOM, o que invalidava o formato JSON para o parser.
- Como usar
- Utilizei a ferramenta com a opção 'Remover Todos os Tipos de BOM' e verifiquei o resultado com a opção 'Visualização Hexadecimal'.
- Resultado
- O caractere BOM foi removido e o script passou a processar o arquivo JSON sem interrupções.
Testar com amostras
json, csv, xmlHubs relacionados
FAQ
O que é um caractere BOM?
O Byte Order Mark (BOM) é um caractere especial inserido no início de arquivos de texto para indicar a ordem dos bytes (endianness) e a codificação UTF, mas que pode causar erros em muitos softwares.
Esta ferramenta altera o conteúdo do meu texto?
Não, a ferramenta remove apenas os caracteres de controle BOM invisíveis no início do arquivo, mantendo todo o restante do seu conteúdo intacto.
Quais tipos de codificação são suportados?
A ferramenta suporta a detecção e remoção de BOM para UTF-8, UTF-16 e UTF-32.
Por que meu arquivo CSV não abre corretamente?
Muitas vezes, o BOM no início do arquivo é interpretado como um caractere inválido pelo Excel ou outros leitores de CSV, impedindo a leitura correta das colunas.
Posso ver onde o BOM estava localizado?
Sim, ao selecionar o formato de saída 'Relatório Detalhado' ou 'Visualização Hexadecimal', você pode identificar a presença e a posição exata dos caracteres BOM.