1) PDF फाइल अपलोड करें PDF से TXT कन्वर्टर में
फाइलें यहाँ छोड़ें या
अनुमत फ़ाइल प्रकार: pdf, ps, xps, pcl, pxl, prn, eps, djvu
2) PDF से TXT कन्वर्टर विकल्प सेट करें
3) निःशुल्क ऑनलाइन TXT कन्वर्टर से अपनी फाइल डाउनलोड करें
यह मुफ़्त टूल एक बार में एक ही फ़ाइल कनवर्ट करता है। Total PDF Converter इसे बैच में करता है - पूरे फ़ोल्डर एक साथ, रिकर्सिव रूप से, और कमांड लाइन या .bat स्क्रिप्ट से।
💾 अपनी फ़ाइल अपलोड करें: साइट पर जाएं, «अपलोड फ़ाइल» पर क्लिक करें और अपनी PDF फ़ाइल का चयन करें.
✍️ रूपांतरण विकल्प सेट करें: आउटपुट प्रारूप के रूप में TXT चुनें और यदि आवश्यक हो तो कोई अतिरिक्त विकल्प समायोजित करें.
रूपांतरित करें और डाउनलोड करें: «रूपांतरित फ़ाइल डाउनलोड करें» पर क्लिक करें ताकि आप अपनी TXT फ़ाइल प्राप्त कर सकें.
PDF टेक्स्ट को एक फिक्स्ड-लेआउट कंटेनर में बंद कर देता है — आप इसे स्क्रीन पर पढ़ सकते हैं, लेकिन इसे टेक्स्ट एडिटर में साफ़-सुथरे तरीके से पेस्ट नहीं कर सकते, grep से खोज नहीं सकते, NLP पाइपलाइन में फ़ीड नहीं कर सकते, या डेटाबेस में इंडेक्स नहीं कर सकते। PDF को TXT में बदलने से पूरी टेक्स्ट सामग्री सादे UTF-8 के रूप में निकलती है: पैराग्राफ़, हेडिंग, टेबल, फ़ुटनोट — PDF में जो कुछ भी है, पढ़ने योग्य क्रम में, एक सादी .txt फ़ाइल में जिसे आप कहीं भी उपयोग कर सकते हैं। अपनी .pdf फ़ाइल ऊपर डालें और सेकंडों में निकाला गया टेक्स्ट डाउनलोड करें।
PDF दस्तावेज़ टेक्स्ट को स्थितिगत निर्देशांकों के साथ ग्लिफ़ स्ट्रीम के रूप में संग्रहीत करता है — शब्दों के रैखिक अनुक्रम के रूप में नहीं। कनवर्टर कंटेंट स्ट्रीम पढ़ता है, PDF के एम्बेडेड फ़ॉन्ट एन्कोडिंग टेबल का उपयोग करके ग्लिफ़ को Unicode वर्णों में मैप करता है, टेक्स्ट ऑब्जेक्ट को पढ़ने के क्रम में सॉर्ट करता है (बाएं से दाएं, ऊपर से नीचे, बहु-कॉलम लेआउट के लिए कॉलम डिटेक्शन सहित), और परिणाम को UTF-8 सादे टेक्स्ट के रूप में लिखता है।
स्कैन किए गए PDF के लिए — कागज़ पेज स्कैन करके बनाए गए दस्तावेज़ — कोई टेक्स्ट लेयर नहीं होती, केवल एक रास्टर इमेज होती है। इन्हें टेक्स्ट आउटपुट बनाने के लिए OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) की आवश्यकता होती है। ऑनलाइन कनवर्टर में स्कैन किए गए पेजों के लिए बिल्ट-इन OCR शामिल है, इसलिए नेटिव-टेक्स्ट PDF और स्कैन किए गए दस्तावेज़ दोनों समर्थित हैं। पासवर्ड-सुरक्षित PDF तब तक प्रोसेस नहीं किए जा सकते जब तक पासवर्ड नहीं हटाया जाता।
| गुण | TXT (सादा टेक्स्ट) | |
|---|---|---|
| लेआउट फ़िडेलिटी | सटीक (फिक्स्ड लेआउट) | कोई नहीं — केवल टेक्स्ट |
| grep/regex से खोज योग्य | नहीं | हाँ |
| Notepad/VS Code में संपादन योग्य | नहीं | हाँ |
| NLP/ML पाइपलाइन में उपयोग योग्य | एक्सट्रैक्शन आवश्यक | हाँ — सीधे |
| डेटाबेस इंडेक्सिंग | एक्सट्रैक्शन आवश्यक | हाँ |
| फ़ाइल साइज़ | बड़ा (लेआउट + फ़ॉन्ट) | न्यूनतम |
| इमेज संरक्षित | हाँ | नहीं |
| फ़ॉन्ट/फ़ॉर्मेटिंग | दृश्य रूप से संरक्षित | हटा दिया जाता है |
| विशेषता | ऑनलाइन (यह पेज) | Total PDF Converter |
|---|---|---|
| फ़ाइल साइज़ सीमा | 50 MB | कोई सीमा नहीं |
| बैच कनवर्जन | एक बार में एक फ़ाइल | पूरे फ़ोल्डर |
| सॉफ़्टवेयर आवश्यक | नहीं | Windows इंस्टॉल |
| स्कैन किए PDF के लिए OCR | हाँ (बिल्ट-इन) | हाँ — भाषा चयन सहित |
| पेज रेंज चयन | पूरा दस्तावेज़ | कस्टम पेज रेंज |
| ऑटोमेशन / CLI | नहीं | हाँ |
| कीमत | मुफ़्त | $49.90 से |
डेस्कटॉप Total PDF Converter एक कमांड में पूरे PDF फ़ोल्डर से टेक्स्ट निकालता है:
TotalPDFConverter.exe C:\Reports\*.pdf /txt /out C:\Text_Output\
स्कैन किए पेजों पर OCR सक्षम करने के लिए /ocr जोड़ें, विशिष्ट पेज निकालने के लिए /pages 1-3, या OCR भाषा सेट करने के लिए /lang fr। नियमित एक्सपोर्ट वर्कफ़्लो के लिए उपयोगी — वित्तीय रिपोर्ट, कानूनी बंडल या संग्रह बैच जॉब। नई PDF को स्वचालित रूप से प्रोसेस करने के लिए .bat फ़ाइल में एम्बेड करें और Windows Task Scheduler से शेड्यूल करें।
| फाइल एक्सटेंशन | |
| श्रेणी | दस्तावेज़ फ़ाइल |
| विवरण | एडोबी सिस्टम्स पोर्टेबल डॉक्यूमेंट फॉर्मेट (पीडीएफ) फॉर्मेट एक मुद्रित दस्तावेज़ की सभी सामग्रियों को इलेक्ट्रॉनिक रूप में प्रदान करता है, जिसमें पाठ और चित्र शामिल हैं, साथ ही तकनीकी विवरण जैसे लिंक, पैमाने, ग्राफ और इंटरैक्टिव सामग्री। आप इस फ़ाइल को मुफ्त एक्रोबेट रीडर में खोल सकते हैं और पृष्ठ या संपूर्ण दस्तावेज़ को स्क्रॉल कर सकते हैं, जो आमतौर पर एक या अधिक पृष्ठ होता है। पीडीएफ फॉर्मेट का उपयोग पूर्व-निर्मित आवधिक लेखपत्रों, ब्रोशर और फ्लायर्स को सहेजने के लिए किया जाता है। |
| संबंधित प्रोग्राम्स | Adobe Viewer Ghostscript Ghostview Xpdf CoolUtils PDF Viewer |
| द्वारा विकसित | Adobe Systems |
| MIME प्रकार | application/pdf application/x-pdf |
| उपयोगी लिंक | PDF फाइलों पर अधिक विस्तृत जानकारी |
| कनवर्ज़न प्रकार | PDF से TXT |
| फाइल एक्सटेंशन | .TXT, .TEXT |
| श्रेणी | दस्तावेज़ फ़ाइल |
| विवरण | TXT प्रारूप सबसे सरल पाठ फ़ाइल मानक है जो स्वरूपण का समर्थन नहीं करता है। ऐसी फ़ाइल में पाठ के वर्ण, टैब और रेखा फ़ीड वर्ण होते हैं। कार्यक्षमता में पुराना होने के बावजूद इसका एक प्रमुख लाभ है - संक्षिप्त फ़ाइल आकार, जिसे साझा करना, डेटा निर्यात/आयात करना आसान होता है। यह विभिन्न कैरसेट्स (DOS, WIN, ISO, KOI-8) का समर्थन करता है। किसी भी पाठ रीडर के साथ TXT फ़ाइल को संगत बनाने के लिए कैरसेट को बदला जा सकता है। स्वरूपण की कमी को पाठक कार्यक्रम में स्वरूपण पैरामीटर सेट करके हल किया जाता है। |
| संबंधित प्रोग्राम्स | Notepad TextEdit WordPad |
| द्वारा विकसित | Various |
| MIME प्रकार | |
| उपयोगी लिंक |