पायथन में ऑप्टिकल कैरेक्टर रिकग्निशन को कैसे लागू करें



यह लेख आपको विस्तृत और व्यापक ज्ञान प्रदान करेगा कि पायथन में एक ऑप्टिकल कैरेक्टर मान्यता को कैसे लागू किया जाए।

ऑप्टिकल चरित्र मान्यता महत्वपूर्ण और एक महत्वपूर्ण पहलू है और प्रोग्रामिंग भाषा। वास्तविक दुनिया के परिदृश्यों में ऐसी अवधारणाओं का अनुप्रयोग कई है। इस लेख में, हम चर्चा करेंगे कि पायथन में ऑप्टिकल कैरेक्टर रिकग्निशन को कैसे लागू किया जाए

ऑप्टिकल कैरेक्टर मान्यता के अनुप्रयोग

टिकट काउंटर इसका उपयोग मार्गों और यात्रियों के विवरण को ट्रैक करने के लिए टिकट पर महत्वपूर्ण जानकारी की स्कैनिंग और पता लगाने के लिए करते हैं। पेपर टेक्स्ट को डिजिटल प्रारूपों में बदलना जहां कैमरे उच्च-रिज़ॉल्यूशन की तस्वीरों को कैप्चर करते हैं और फिर उन्हें एक शब्द या एक पीडीएफ प्रारूप में लाने के लिए ओसीआर का उपयोग किया जाता है।





charachters

अजगर के साथ ओसीआर की शुरूआत 'टेसेरैक्ट' और 'ऑर्कैड' जैसी बहुमुखी पुस्तकालयों को जोड़ने का श्रेय दिया जाता है। इन पुस्तकालयों ने कई कोडर्स और डेवलपर्स को अपने कोड डिज़ाइन को सरल बनाने में मदद की हैऔर उन्हें अपनी परियोजनाओं के अन्य पहलुओं पर अधिक समय बिताने की अनुमति दें। चूंकि लाभ बहुत अधिक हैं, आइए हम यह देखते हैं कि यह क्या है और यह कैसे किया जाता है।



कैसे एक jframe बनाने के लिए

पायथन में एक ऑप्टिकल कैरेक्टर मान्यता का निर्माण

हमें सबसे पहले 'pytesseract' का उपयोग करके एक वर्ग बनाने की आवश्यकता है। यह वर्ग हमें छवियों को आयात करने और उन्हें स्कैन करने में सक्षम करेगा। इस प्रक्रिया में यह एक्सटेंशन 'ocr.py' के साथ फाइल आउटपुट करेगा। हमें नीचे दिए गए कोड को देखते हैं। फ़ंक्शन ब्लॉक 'process_image' का उपयोग हमारे द्वारा प्राप्त पाठ को तेज करने के लिए किया जाता है।

निम्न मार्ग हैंडलर और व्यू फ़ंक्शन एप्लिकेशन (app.py) में जोड़े जाते हैं।

राउटर हैंडलर कोड



// रूट हैन्डलर @ app.route ('/ v {} / ocr'.format (_VERSION), विधियाँ = [' POST ']) ocr () को आज़माएं: url = request.json (' image_url '] अगर' jpg 'in url: output = process_image (url) रिटर्न jsonify ({' आउटपुट ': आउटपुट}) और: jsonify ({' error ':' only '.jpg फाइलें, कृपया') को छोड़कर: रिटर्न jaify ({'error' ')। ':' क्या आपको भेजने का मतलब है: {'image_url': 'some_jpeg_url'} '})

OCR इंजन कोड

// OCR इंजन आयात PIL आयात से PILesseract आयात अनुरोध PIL से आयात छवि PIL आयात ImageFilter से StringIO आयात Stringio def process_image (url): छवि = _get_image (url) छवि। url): वापसी Image.open (StringIO (request.get (url) .content)) //

कृपया आयातों को अपडेट करना और एपीआई संस्करण संख्या जोड़ना सुनिश्चित करें।

आयात os आयात लॉगिंग आयात से लॉगिंग फॉर्मैटर, फाइलहैंडलर फ्लास्क आयात से फ्लास्क, अनुरोध, ocr आयात प्रक्रिया से jsonify_image _VERSION = 1 # एपीआई संस्करण

हम OCR इंजन के फ़ंक्शन के JSON रिस्पांस में जोड़ रहे हैं जो कि 'process_image ()' है। JSON का उपयोग API में और बाहर जाने वाली जानकारी जुटाने के लिए किया जाता है। हम इसे स्थापित करने के लिए पीआईएल से 'छवि' पुस्तकालय का उपयोग करके ऑब्जेक्ट फ़ाइल में प्रतिक्रिया पास करते हैं।

कृपया ध्यान दें कि यह कोड केवल .jpg चित्रों के साथ ही सर्वश्रेष्ठ प्रदर्शन करता है। यदि हम जटिल पुस्तकालयों का उपयोग करते हैं जो कई छवि स्वरूपों को दिखा सकते हैं तो सभी छवियों को प्रभावी ढंग से संसाधित किया जा सकता है। यह भी ध्यान दें, यदि आप इस कोड को स्वयं आज़माने में रुचि रखते हैं, तो कृपया PIL स्थापित करें जो पहले 'पिलर' से प्राप्त किया गया है

& बैल ऐप को चलाकर शुरू करें, जो 'app.py' है:

// $ cd ../home/flask_server/ $ python app.py //

एक अन्य टर्मिनल रन में & bull;

// $ कर्ल -X POST http: // localhost: 5000 / v1 / ocr -d '{' image_url ':' some_url '}' -H 'सामग्री-प्रकार: अनुप्रयोग / json'

उदाहरण के लिए:

// $ कर्ल -X POST http: // localhost: 5000 / v1 / ocr -d '{' C: UsersakashDownloadsPic1 ':' https://edureka.com/images/blog_images/ocr/ocr/jpg '}' - ' H 'सामग्री-प्रकार: अनुप्रयोग / json' {'आउटपुट': 'ABCDEnFGH I JnKLMNOnPQRST'} //

ओसीआर इंजन के लाभ और नुकसान

अजगर में OCR का उपयोग करने के कई अनुप्रयोगों में से, लोकप्रिय हस्तलिपि पहचान है। लोग इसे लागू करते हैं लिखित पाठ को फिर से बनाने के लिए जो मूल स्क्रिप्ट की फोटोकॉपी करने के बजाय कई प्रतियों में आबाद किया जा सकता है। यह एकरूपता और सुगमता लाने के लिए है।

OCR PDF के ग्रंथों में परिवर्तित करने और उन्हें चर के रूप में संग्रहीत करने में भी उपयोगी है। इसे बाद में अतिरिक्त कार्यों के लिए पूर्व-प्रसंस्करण की किसी भी राशि के अधीन किया जा सकता है। हालाँकि, OCR की अवधारणा पायथन की दुनिया में एक लाभदायक विषय है, लेकिन यह सुनिश्चित करता है कि इसके नुकसान का हिस्सा है।

OCR हमेशा 100% सटीकता की गारंटी नहीं दे सकता है। आर्टिफिशियल इंटेलिजेंस कॉन्सेप्ट्स की मदद से कई घंटे की ट्रेनिंग की जरूरत होती है, जिससे ओसीआर इंजन खराब इमेज को जानने और पहचानने में सक्षम हो सके। लिखावट छवियों को पहचाना जा सकता है लेकिन वे लेखन की शैली, पृष्ठ का रंग, छवि के विपरीत और छवि के संकल्प जैसे कई कारकों पर निर्भर करते हैं।

इसके साथ, हम पायथन लेख में इस ऑप्टिकल कैरेक्टर रिकॉग्निशन के अंत में आते हैं। मुझे उम्मीद है कि आप OCR कैसे काम करते हैं, इसकी समझ आपको है।

अपने विभिन्न अनुप्रयोगों के साथ अजगर पर गहराई से ज्ञान प्राप्त करने के लिए, आप कर सकते हैं 24/7 समर्थन और आजीवन पहुंच के साथ लाइव ऑनलाइन प्रशिक्षण के लिए।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? 'पाइथन में ऑप्टिकल कैरेक्टर रिकॉग्निशन' के कॉमेंट सेक्शन में इनका उल्लेख करें और हम आपके पास वापस आ जाएंगे।