لديك مجلدات من ملفات DOC وDOCX وتحتاج جسم النص القابل للقراءة، وليس التنسيق — للفهرسة الكاملة للنص، استيعاب محرّك البحث، خطوط أنابيب NLP والتعلّم الآلي، مراجعة الاكتشاف الإلكتروني، أو الأرشفة طويلة الأمد. فتح كل ملف في Word وحفظه كنص خالص لا يتدرّج بعد حفنة من الملفات، ويترك آثار تنسيق Word خلفه. Total Doc Converter X يجرِّد تنسيق Word ويكتب نص UTF-8 أو ANSI نظيفًا من سطر الأوامر، دفعةً، بدون واجهة رسومية وبدون الحاجة إلى تثبيت Microsoft Word. ثبّته على خادم Windows، استدعِه من سكربت أو عبر ActiveX، ودعه يعمل دون إشراف.
*.docx) وسيعالج المحوّل كل الملفات المطابقة في تشغيلة واحدة
(30 يومًا، بدون بريد إلكتروني)
(ترخيص خادم، دائم)
Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022
DOC وDOCX هما تنسيقا Microsoft Word مبنيّان للقراءة البشرية والتحرير. ملف DOCX هو حاوية ZIP بأجزاء XML، ووسائط مضمّنة، وأنماط، وسجل المراجعات، والتعليقات، والتغييرات المتعقّبة. لا يهتم محرّك بحث أو مفهرس أو محلِّل LLM أو خط أنابيب اكتشاف إلكتروني بأي من ذلك — يهتم بالنص القابل للقراءة. توجيه تلك الأنظمة إلى ملفات Word خام يفرض على كل مستهلك أن يشحن محلِّل DOC/DOCX خاص به، والمحلِّلات تختلف على الحالات الحدّية.
TXT هو القاسم المشترك الأدنى. يقرأ كل مفهرس بحث وكل مجموعة أدوات NLP وكل أداة على نمط grep وكل أداة diff النص الخالص بنفس الطريقة. تحويل Word إلى TXT مرة واحدة، على الخادم، يعطي كل مستهلك تابع نفس المدخلات النظيفة. تنبسط الجداول إلى صفوف مفصولة بعلامات تبويب أو بفواصل أسطر. تختفي الصور. يمكن الاحتفاظ بالرؤوس والتذييلات أو تجريدها، حسب علامتك. ما يبقى هو محتوى الجسم، جاهز للفهرسة أو استخراج الميزات.
| DOC / DOCX | TXT | |
|---|---|---|
| المحتوى | نص + تنسيق + وسائط | نص فقط |
| حجم الملف | عشرات إلى مئات الكيلوبايت | عادةً 5–20% من الأصل |
| الفهرسة | تتطلّب محلِّل DOC/DOCX | يعمل مع أي مفهرس أو محلِّل |
| الجداول | خلايا منظَّمة | منبسطة إلى صفوف مفصولة بعلامات تبويب |
| الصور | مضمّنة | تُزال |
| الجمهور | المراجعون، المحرّرون | البحث، NLP، الأرشفة، الاكتشاف الإلكتروني |
نزّل المُثبِّت من الرابط أعلاه وشغّله على خادم أو محطة عمل Windows. يستغرق التثبيت أقل من دقيقة. لا حاجة لتثبيت Microsoft Word أو LibreOffice أو متصفح — يحلّل المحوّل DOC وDOCX مباشرةً بمحرّكه الخاص، ويكتب نصًّا خالصًا في الترميز الذي تحدّده.
افتح cmd.exe أو PowerShell. الملف التنفيذي للمحوّل هو DOCConverter.exe، ويقع في مجلد التثبيت (عادةً C:\Program Files\CoolUtils\TotalDocConverterX\). أضفه إلى متغيّر PATH في النظام أو استخدم المسار الكامل في أوامرك.
أبسط أمر يُحوّل جميع ملفات DOCX في مجلد إلى TXT:
DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8
يُعالج هذا كل ملف .docx في C:\Docs\ ويحفظ ملفات TXT الناتجة في C:\Output\. كل ملف Word يُنتج ملف TXT واحدًا بنفس الاسم الأساسي. استخدم *.doc لمستندات Word 97–2003 القديمة، أو *.do* للقبض على الاثنين معًا.
تحكّم في إخراج TXT بعلامات إضافية:
DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log
-Encoding UTF-8 — ترميز الإخراج (UTF-8، UTF-16، ANSI، 1251، 1252، إلخ.)-BOM 0 — قمع علامة ترتيب بايتات UTF-8؛ استخدم -BOM 1 لكتابتها-LineBreaks CRLF — نمط Windows \r\n أو LF لنمط Unix \n-log C:\Logs\word2txt.log — كتابة سجل تحويل للتحققاحفظ أمرك في ملف .bat وجدوِله باستخدام Windows Task Scheduler:
@echo off "C:\Program Files\CoolUtils\TotalDocConverterX\DOCConverter.exe" C:\Incoming\*.docx C:\Archive\TXT\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log
يُشغّل هذا التحويل كل ليلة (أو بأي فاصل زمني تحدّده) ويكتب ملف سجل لكي تتمكّن من التحقق من النتائج. اربط مجلد الإخراج بمفهرس البحث أو مهمة استيعاب NLP وسيعمل خط الأنابيب من البداية إلى النهاية دون خطوة يدوية.
يتضمّن Total Doc Converter X واجهة ActiveX كاملة. يمكنك استدعاء المحوّل من أي بيئة متوافقة مع COM — .NET أو VBScript أو PHP أو Python أو Ruby أو ASP. يتيح لك ذلك دمج تحويل Word إلى نص في تطبيق الويب الخاص بك أو منصة الاكتشاف الإلكتروني أو سير عمل المستندات دون اللجوء إلى عملية سطر أوامر خارجية.
مثال (C#/.NET):
DOCConverterX Cnv = new DOCConverterX();
Cnv.Convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");
مثال (PHP):
$c = new COM("DOCConverter.DOCConverterX");
$c->convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");
يعمل نفس الاستدعاء من ASP.NET وVBScript وPython وRuby وPerl وJavaScript (Windows Script Host). يمكن لتطبيق الويب الخاص بك قبول ملفات Word المرفوعة وإعادة نص UTF-8 نظيف إلى المفهرس أو نقطة نهاية LLM أو طبقة التخزين في الوقت الفعلي.
| الميزة | المحوّلات عبر الإنترنت | Total Doc Converter X |
|---|---|---|
| المعالجة الدفعية | ملف واحد في كل مرة | عدد غير محدود من الملفات لكل دفعة |
| خصوصية الملفات | تُرفع الملفات إلى خادم طرف ثالث | الملفات لا تغادر جهازك |
| التحكم بالترميز | UTF-8 فقط، BOM إلزامي | UTF-8، UTF-16، ANSI، صفحات الرموز، BOM تشغيل/إيقاف |
| المحتوى متعدّد اللغات | غير متّسق على CJK والكتابات RTL | يُحافَظ على Unicode الكامل |
| الأتمتة | يدوي فقط | سطر الأوامر، .bat، Task Scheduler، ActiveX |
| النشر على الخادم | غير ممكن | مصمّم للخوادم، لا حاجة لواجهة رسومية |
| يتطلب تثبيت Word | غير قابل للتطبيق | لا |
| يتطلب إنترنت | نعم | لا |
يحلّل المحوّل DOC وDOCX مباشرةً. لست بحاجة إلى تثبيت Microsoft Office أو LibreOffice أو أي معالج نصوص على الخادم. يتجنّب ذلك تكاليف الترخيص وعدم الاستقرار المعروف لأتمتة Word في سيناريوهات غير مُشرف عليها.
صُمِّم Total Doc Converter X للاستخدام دون إشراف. لا نوافذ واجهة رسومية، لا مربعات حوار، لا مطالبات تأكيد. يعمل بصمت من سطر الأوامر أو كجزء من خدمة — تمامًا ما يحتاجه خادم الإنتاج.
لمفهرسات البحث وأطر عمل NLP والأرشيفات القديمة قواعد ترميز خاصة بها. يكتب Total Doc Converter X UTF-8 مع أو بدون BOM، وUTF-16 LE أو BE، وصفحات Windows ANSI 1251 و1252، وأي صفحة رموز أخرى مسجَّلة على النظام. عقود سيريلية ودلائل منتجات يابانية ومراسلات عربية ووثائق فنية ألمانية كلها تنجو من التحويل سليمة — يقرأ المحوّل DOC/DOCX المصدر كـUnicode ويكتب الترميز المُختار للإخراج دون كتابة بحروف لاتينية ضائعة. اضبط -Encoding مرة واحدة في ملف .bat الخاص بك ويطابق الإخراج المستهلكين التابعين بايتًا ببايت.
تُحوّل أداة سطر الأوامر نفسها Word إلى PDF وHTML وRTF وXLS وTIFF وJPEG وأكثر. تثبيت واحد يغطي كل احتياجات تحويل Word لديك. غيّر -c TXT إلى -c PDF وستحصل على إخراج PDF بنفس مزايا الدفعات والأتمتة.
(30 يومًا، بدون بريد إلكتروني أو بطاقة ائتمان)
(ترخيص خادم، دائم)
Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022
"نُعالج عدّة آلاف من معروضات DOC وDOCX لكل قضية. يعمل Total Doc Converter X كدفعة ليلية على خادم الاكتشاف الإلكتروني ويُنتج نسخ نص UTF-8 للبحث بالكلمات المفتاحية والتجميع المفاهيمي. جسم النص نظيف — لا آثار Word، لا ضوضاء رؤوس/تذييلات، الجداول منبسطة إلى علامات تبويب. كان ضبط -BOM 0 التفصيل الصغير الذي جعل مفهرسنا سعيدًا من المحاولة الأولى."
Caroline Whitford Litigation Support Specialist, Mid-Atlantic Law Group
"نُغذّي مجموعات نصية للعقود في خط أنابيب تضمين للبحث المعزَّز بالاسترجاع. كان تحليل DOCX داخل خط الأنابيب بطيئًا وهشًّا، واختلف python-docx مع Word على خلايا الجداول. التحويل المسبق إلى TXT خالص بـDOCConverter.exe أزال المشكلتين. ملف .bat يعيش في Task Scheduler، تقرأ مهمة التضمين TXT، وتوقّفنا عن مصارعة Word XML."
Devansh Iyer NLP Engineer
"طلب الامتثال منّا الاحتفاظ بنسخ نص خالص من كل مستند سريري إلى جانب الأصل للأرشفة طويلة الأمد. اخترنا Total Doc Converter X لأنه لا يحتاج إلى Word على خادم الملفات، وسمحت لنا علامة الترميز بتوحيد UTF-8 بدون BOM عبر الأرشيف. يمكن أن تكون الوثائق أكثر تفصيلًا حول قواعد انبساط الجداول، لكن الدعم أجاب على أسئلتنا في نفس اليوم."
Margaret Holloway Records Manager, Regional Health Network
DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8. يُحوّل هذا كل ملف Word في المجلد المصدر إلى TXT. استخدم *.doc لملفات Word 97–2003 القديمة، أو *.do* للقبض على DOC وDOCX في تشغيلة واحدة.-Encoding متبوعةً بالترميز المستهدف. تشمل القيم المدعومة UTF-8 وUTF-16 وUTF-16BE وANSI وأي صفحة رموز Windows مسجَّلة على النظام (مثلًا 1251 لـWindows السيريلي أو 1252 للأوروبية الغربية). تتطابق بايتات الإخراج تمامًا مع ما يتوقّعه المفهرس أو المحلِّل التابع.-BOM 0 لكتابة تدفّق UTF-8 نظيف بدون علامة ترتيب بايتات. استخدم -BOM 1 لإصدار BOM. ترفض بعض مفهرسات البحث ومحلِّلات JSON الملفات التي تبدأ بـBOM، بينما تتطلّبها بعض أدوات Windows الأصلية — تتيح لك العلامة مطابقة أي جانب دون معالجة لاحقة.-Encoding UTF-8 لتغطية Unicode كاملة في تدفّق بايتات واحد، أو اختر صفحة رموز إذا تطلّب معيار الأرشيف لديك ذلك.-IncludeHeaders 0 لإسقاطها كليًا، أو -IncludeHeaders 1 للاحتفاظ بها. تُجرّد أرقام الصفحات لأن TXT ليس له مفهوم للصفحات.DOCConverter.DOCConverterX). يمكنك استدعاؤه من .NET أو PHP أو Python أو VBScript أو ASP أو Ruby أو Perl أو أي بيئة أخرى متوافقة مع COM. يمكن لتطبيق الويب الخاص بك قبول ملفات DOC/DOCX المرفوعة وإعادة نص UTF-8 إلى المفهرس أو نقطة نهاية LLM في الوقت الفعلي.
string src="C:\\test\\Source.Doc";
string dest="C:\\test\\Dest.PDF";
DocConverterX Cnv = new DocConverterX();
Cnv.Convert(src, dest, "-c PDF -log c:\\test\\Doc.log");
MessageBox.Show("التحويل مكتمل!");
تنزيل مثال .NET Doc Covnerter
dim C
Set C=CreateObject("DocConverter.DocConverterX")
C.Convert "c:\source.DOC", "c:\dest.TIF", "-cTIF -log c:\doc.log"
Response.Write C.ErrorMessage
set C = nothing
dim C
Set C=CreateObject("DocConverter.DocConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Rresponse.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite c.ConvertToStream("C:\www\ASP\Source.doc", "C:\www\ASP", "-cpdf -log c:\html.log")
set C = nothing
بعض الأمثلة الإضافية في C# خصيصًا لـ ASP.net. إذا كنت بحاجة إلى أمثلة بلغات أخرى، يرجى الاتصال بنا. سنقوم بإنشاء أي مثال خصيصًا لك.
$src="C:\test.doc";
$dest="C:\test.htm";
if (file_exists($dest)) unlink($dest);
$c= new COM("DocConverter.DocConverterX");
$c->convert($src,$dest, "-c htm -log c:\doc.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;
require 'win32ole'
c = WIN32OLE.new('DocConverter.DocConverterX')
src="C:\\test\\test.docx";
dest="C:\\test\\test.pdf";
c.convert(src,dest, "-c PDF -log c:\\test\\Doc.log");
if not File.exist?(dest)
puts c.ErrorMessage
end
import win32com.client
import os.path
c = win32com.client.Dispatch("DocConverter.DocConverterX")
src="C:\\test\\test.docx";
dest="C:\\test\\test.pdf";
c.convert(src, dest, "-c PDF -log c:\\test\\Doc.log");
if not os.path.exists(file_path):
print(c.ErrorMessage)
uses Dialogs, Vcl.OleAuto;
var
c: OleVariant;
begin
c:=CreateOleObject('DocConverter.DocConverterX');
C.Convert('c:\test\source.docx', 'c:\test\dest.pdf', '-cPDF -log c:\test\Doc.log');
IF c.ErrorMessage<> Then
ShowMessage(c.ErrorMessage);
end;
var c = new ActiveXObject("DocConverter.DocConverterX");
c.Convert("C:\\test\\source.docx", "C:\\test\\dest.pdf", "-c PDF");
if (c.ErrorMessage!="")
alert(c.ErrorMessage)
use Win32::OLE; my $src="C:\\test\\test.docx"; my $dest="C:\\test\\test.pdf"; my $c = CreateObject Win32::OLE 'DocConverter.DocConverterX'; $c->convert($src,$dest, "-c pdf -log c:\\test\\Doc.log"); print $c->ErrorMessage if -e $dest;
قم بتنزيل النسخة التجريبية المجانية وحول ملفاتك في دقائق.
لا تحتاج إلى بطاقة ائتمان أو بريد إلكتروني.