UTF-8 кодує текст Unicode як байти змінної довжини — за замовчуванням для веб-файлів, файлів JSON і сучасних файлів.
UTF-8 представляє ASCII одним байтом, а інші сценарії — 2–4 байтами — це зворотно сумісно з ASCII і ефективне для англомовного вмісту. Mojibake (спотворений текст) зазвичай означає, що файл було прочитано з неправильним кодуванням.
Завжди оголошуйте charset=utf-8 у HTML і JSON. Інструменти кодування Tentaco виявляють і конвертують текст локально, коли ви успадковуєте експортовані файли Windows-1252 або Latin-1.