Инструменты конвертации регистра, кодировки и нормализации текста

Сравните в одном хабе конвертацию регистра, ширины символов, кодировок, работу с quoted-printable и встроенную нормализацию текста.

Этот хаб посвящен текстовым преобразованиям до очистки или публикации: смене стиля регистра, исправлению кодировок, переключению между полуширинными и полноширинными символами, нормализации дат или валют в тексте и разбиению текста на структурированные списки слов.

Факты о кластере

Тип задачи
convert
Families
text
Инструменты
10
Подкластеры
3

Зачем существует этот хаб

Преобразование текста часто объединяет регистр, кодировку и встроенную нормализацию, потому что один и тот же грязный источник обычно требует всех трех шагов.
Он помогает сравнить низкоуровневые преобразования символов с более высокоуровневой нормализацией дат, валют и границ слов.
Он дает более понятную отправную точку для миграции, подготовки локализации, очистки импортов и стандартизации обычного текста.

Избранные инструменты

Расширенный конвертер регистра
Преобразование между CamelCase, snake_case, kebab-case, PascalCase и другими соглашениями об именовании
Конвертер Кодировки Файла
Преобразование кодировки файлов между UTF-8, GBK, ISO-8859-1 и другими кодировками символов
Преобразователь Полноширинных в Полуширинные
Преобразование полноширинных символов в полуширинные для правильного форматирования текста
Преобразователь Полуширинных в Полноширинные
Преобразование полуширинных символов в полноширинные для форматирования текста CJK
Quoted-Printable Декодировщик
Декодировать формат Quoted-Printable в обычный текст
Quoted-Printable Кодировщик
Кодировать текст в формат Quoted-Printable (используется в MIME электронной почты)
Конвертер Чисел в Слова
Преобразует числа в слова на нескольких языках
Разделитель Слов
Разделить текст на отдельные слова, каждое слово на новой строке
Унификатор Формата Даты в Тексте
Находит и унифицирует форматы дат внутри текстового содержимого
Нормализатор Валют в Тексте
Находит, конвертирует и нормализует значения валют в текстовом содержимом

Проверить на примерах

text

Связанные хабы

FAQ

Что можно делать в этом хабе?

Здесь можно менять стиль регистра, переключать ширину символов, исправлять кодировки, кодировать и декодировать quoted-printable, переводить числа в слова и нормализовать даты или валюту внутри текста.

Для кого этот хаб?

Хаб полезен разработчикам, командам локализации, редакторам контента, командам очистки данных и всем, кто стандартизирует текст перед дальнейшей обработкой.

С чего лучше начать?

Начните с самой глубокой проблемы текста: ошибки кодировки или ширины символов обычно нужно исправить до смены регистра или встроенной нормализации.