Document Grinding क्या है ,कैसे यह कैसे काम करता है ?
दस्तावेज़ पीसने सार्थक डेटा निकालने के लिए दस्तावेजों का विश्लेषण करने की प्रक्रिया है। यह शब्द अक्सर कंप्यूटर हैकिंग से जुड़ा होता है, क्योंकि हैकर्स गोपनीय डेटा प्रकट करने के लिए दस्तावेजों को ‘पीस’ सकते हैं। हालांकि, दस्तावेज पीसने का उपयोग गैर-घातक उद्देश्यों के लिए भी किया जाता है। उदाहरणों में अज्ञात फ़ाइल प्रकारों की पहचान करना और फ़ाइल मेटाडेटा देखना शामिल है. सादे पाठ और बाइनरी दोनों फाइलों पर दस्तावेज़ पीसने का कार्य करना संभव है।
टेक्स्ट फाइलें
टेक्स्ट फ़ाइलों को पीसने की प्रक्रिया एक सरल प्रक्रिया है क्योंकि वे डेटा को सादे पाठ के रूप में संग्रहीत करते हैं। आप ग्रेप या किसी अन्य खोज उपयोगिता जैसे उपकरण का उपयोग करके टेक्स्ट दस्तावेज़ के भीतर वर्णों और तारों की खोज कर सकते हैं। चूंकि टेक्स्ट प्रोसेसिंग अपेक्षाकृत तेज कंप्यूटर ऑपरेशन है, इसलिए एक सेकंड से भी कम समय में कई बड़े दस्तावेजों को पीसना संभव हो सकता है।
दस्तावेज़ पीसने के लिए लक्षित सामान्य टेक्स्ट फ़ाइल प्रकारों में लॉग फ़ाइलें शामिल हैं (<ए href=’https://fileinfo.com/extension/log’ target=’fileinfo’>। लॉग, <href=’https://fileinfo.com/extension/txt’ लक्ष्य =’fileinfo’> । TXT) और विन्यास फ़ाइलें (<ए href=’https://fileinfo.com/extension/conf’target=’fileinfo’>। कन्फ, <ए href=’https://fileinfo.com/extension/cnf’ target=’fileinfo’> । सीएनएफ) । उदाहरण के लिए, यदि कोई हैकर वेब सर्वर तक पहुंच प्राप्त करता है, तो वह इन फ़ाइलों को उपयोगकर्ता नाम, पासवर्ड और अन्य गोपनीय डेटा के लिए खोज सकता है।
बाइनरी फाइल्स
बाइनरी फ़ाइलों में कुछ सादे पाठ हो सकते हैं, लेकिन वे बाइनरी डेटा – 1s और 0s भी संग्रहीत करते हैं। बाइनरी डेटा को पीसना अधिक कठिन है क्योंकि इसे टेक्स्ट सर्च टूल के साथ खोजा नहीं जा सकता है। इसके अतिरिक्त, कई बाइनरी फ़ाइलें एक मालिकाना फ़ाइल प्रारूप में सहेजी जाती हैं, जो संबंधित आवेदन के बिना पार्स करना मुश्किल है। इसलिए बाइनरी दस्तावेज़ पीसने आम तौर पर एक दस्तावेज़ के हेडर और पाद लेख पर केंद्रित होता है, जिसमें सादे पाठ हो सकते हैं। इसका उद्देश्य फ़ाइल मेटाडेटा निकालने का भी हो सकता है।
कई बाइनरी फाइलों में फाइल के हेडर में फाइल टाइप के बारे में जानकारी होती है। उदाहरण के लिए, नमूना छवि में, हेडर में ‘पीएनजी’ अक्षरों से संकेत मिलता है कि फ़ाइल एक पीएनजी छवि है। यह जानकारी फ़ाइल प्रकार की पहचान करने के लिए उपयोगी है क्योंकि इसमें फ़ाइल एक्सटेंशन नहीं है। इसी तरह, डिजिटल तस्वीरों में अक्सर फोटो लेने पर सेवित छिपे हुए EXIF डेटा होते हैं। इमेज-व्यूइंग प्रोग्राम या दस्तावेज़ पीसने वाली स्क्रिप्ट इस जानकारी का पता लगाने और निकालने में सक्षम हो सकती है।
इस पृष्ठ पर Document Grinding की परिभाषा एक मूल SharTec.eu परिभाषा है। मैं SharTec का लक्ष्य कंप्यूटर शब्दावली को इस तरह से समझाना है जो समझने में आसान हो। हम प्रकाशित हर परिभाषा के साथ सादगी और सटीकता के लिए प्रयास करते हैं। यदि आपके पास दस्तावेज़ पीस परिभाषा के बारे में प्रतिक्रिया है या एक नया तकनीकी शब्द सुझाना चाहते हैं, तो कृपया हमसे संपर्क करें।