Tesseract açık kaynaklı bir OCR motorudur; birçok tarayıcı WASM ve sunucu OCR hattını destekler.
Tesseract, taranan görüntülerdeki ve PDF sayfalarındaki metni tanır; dil paketleri DE, EN ve 100'den fazla komut dosyası için doğruluğu artırır. Ön işleme (eğim düzeltme, kontrast) sonuçları artırır.
Tentaco PDF OCR, desteklendiği durumlarda WASM OCR'yi kullanır; hassas taramalar için işleme sekmede kalır. Metin katmanlarına sahip doğuştan dijital PDF'ler için bunun yerine PDF'den Metne özelliğini kullanın.