UTF-8 кодирует текст Unicode в виде байтов переменной длины — значение по умолчанию для Интернета, JSON и современных файлов.
UTF-8 представляет ASCII в одном байте, а другие сценарии — в 2–4 байтах — обратно совместим с ASCII и эффективен для контента с большим количеством английского языка. Моджибаке (искаженный текст) обычно означает, что файл был прочитан с неправильной кодировкой.
Всегда объявляйте charset=utf-8 в HTML и JSON. Инструменты кодирования Tentaco обнаруживают и преобразуют текст локально, когда вы наследуете устаревший экспорт Windows-1252 или Latin-1.