Tesseract एक ओपन-सोर्स OCR इंजन है - जो कई ब्राउज़र WASM और सर्वर OCR पाइपलाइनों को शक्ति प्रदान करता है।
टेसेरैक्ट स्कैन की गई छवियों और पीडीएफ पृष्ठों में पाठ को पहचानता है - भाषा पैक DE, EN और 100+ स्क्रिप्ट के लिए सटीकता में सुधार करते हैं। प्रीप्रोसेसिंग (डेस्क्यू, कंट्रास्ट) परिणामों को बढ़ाती है।
टेंटाको पीडीएफ ओसीआर WASM OCR का उपयोग करता है जहां समर्थित है - संवेदनशील स्कैन के लिए प्रसंस्करण टैब में रहता है। टेक्स्ट परतों के साथ जन्मजात-डिजिटल पीडीएफ के लिए, इसके बजाय पीडीएफ टू टेक्स्ट का उपयोग करें।