Ключевые факты
- Категория
- Преобразование и кодирование
- Типы входных данных
- textarea, select, checkbox
- Тип результата
- text
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Конвертер Unicode-эскейпов позволяет быстро преобразовывать обычный текст в экранированные последовательности Unicode (такие как \uXXXX, \u{XXXXXX} или U+XXXX) и обратно, а также выполнять нормализацию символов по стандартам NFC, NFD, NFKC и NFKD для устранения проблем с кодировкой в исходном коде и конфигурационных файлах.
Когда использовать
- •При необходимости вставить специальные символы, эмодзи или не-ASCII символы в исходный код JavaScript, Java, Python или JSON в виде безопасных эскейп-последовательностей.
- •При декодировании логов, конфигурационных файлов или ответов API, содержащих экранированные последовательности вида \uXXXX.
- •При подготовке текста к сравнению или хранению, когда нужно устранить различия в представлении составных символов с помощью нормализации Unicode.
Как это работает
- •Вставьте исходный текст или Unicode-эскейп последовательности в поле ввода.
- •Выберите нужную операцию: преобразование в эскейп-последовательности, обратное декодирование или нормализацию Unicode.
- •Настройте дополнительные параметры, такие как стиль эскейпа (например, \uXXXX или ES6 \u{XXXXXX}), форму нормализации и необходимость пропускать стандартные ASCII-символы.
- •Получите мгновенно обработанный результат в выходном текстовом поле.
Сценарии использования
Примеры
1. Кодирование кириллицы для Java-свойств
Java-разработчик- Контекст
- Разработчику необходимо добавить локализованные строки на русском языке в файл конфигурации .properties, который поддерживает только ASCII.
- Проблема
- Символы кириллицы отображаются некорректно или вызывают ошибки сборки, если они записаны в исходном виде.
- Как использовать
- Вставьте строку "Привет" в поле ввода, выберите операцию "Текст в \u эскейп", установите стиль эскейпа "\uXXXX (только BMP)" и включите опцию "Эскейпить только не-ASCII".
- Пример конфигурации
-
Операция: escape, Стиль: uXXXX, asciiOnly: true - Результат
- Получена строка \u041f\u0440\u0438\u0432\u0435\u0442, которая корректно распознается Java-приложением без изменения кодировки файла.
2. Декодирование ответа API
Фронтенд-разработчик- Контекст
- При отладке сетевых запросов в консоли разработчик видит JSON-ответ, где русские буквы заменены на шестнадцатеричные коды.
- Проблема
- Текст сообщения об ошибке \u041e\u0448\u0438\u0431\u043a\u0430 \u0434\u043e\u0441т\u0443\u043f\u0430 невозможно прочитать визуально.
- Как использовать
- Скопируйте закодированную строку, вставьте ее в конвертер и выберите операцию "\u эскейп в текст".
- Пример конфигурации
-
Операция: unescape - Результат
- Строка мгновенно преобразуется в читаемый текст "Ошибка доступа".
3. Нормализация текста перед сравнением строк
Инженер данных- Контекст
- При слиянии двух баз данных имена пользователей с буквой "ё" не совпадают, так как в одной базе буква записана одним символом (NFC), а в другой — парой символов (буква "е" + двоеточие сверху, NFD).
- Проблема
- Строки визуально идентичны, но имеют разную длину и не проходят проверку на равенство в коде.
- Как использовать
- Вставьте проблемный текст, выберите операцию "Нормализация Unicode" и укажите форму нормализации "NFC".
- Пример конфигурации
-
Операция: normalize, Форма Нормализации: NFC - Результат
- Все составные символы преобразуются в единые монолитные кодовые точки, что позволяет корректно сопоставить записи.
Проверить на примерах
image, textСвязанные хабы
FAQ
Что делает опция «Эскейпить только не-ASCII»?
Она оставляет стандартные латинские буквы, цифры и знаки препинания в исходном виде, кодируя только кириллицу, эмодзи и другие спецсимволы.
Какие форматы эскейп-последовательностей поддерживает конвертер?
Поддерживаются форматы \uXXXX (включая суррогатные пары для символов вне BMP), формат ES6 \u{XXXXXX} и шестнадцатеричные кодовые точки U+XXXX.
Чем отличаются формы нормализации NFC и NFD?
NFC объединяет базовые символы и диакритические знаки в один составной символ, а NFD раскладывает их на отдельные составляющие кодовые точки.
Можно ли с помощью этого инструмента декодировать JSON с эскейп-последовательностями?
Да, выберите операцию «\u эскейп в текст», чтобы преобразовать все последовательности вида \uXXXX в читаемые символы.
Работает ли конвертер с эмодзи и редкими символами?
Да, для символов за пределами базовой многоязыковой плоскости (BMP) вы можете использовать стиль суррогатных пар или формат ES6 \u{XXXXXX}.