UTF-8 codifica il testo Unicode come byte di lunghezza variabile: l'impostazione predefinita per file Web, JSON e moderni.
UTF-8 rappresenta ASCII in un byte e altri script in 2-4 byte: retrocompatibile con ASCII ed efficiente per contenuti con uso intensivo di inglese. Mojibake (testo confuso) di solito significa che un file è stato letto con il set di caratteri sbagliato.
Dichiara sempre charset=utf-8 in HTML e JSON. Gli strumenti di codifica Tentaco rilevano e convertono il testo localmente quando erediti esportazioni Windows-1252 o Latin-1 legacy.