Logo
Begin Producten Ondersteuning Contact Over Ons
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware


Word naar tekst converteren via de opdrachtregel — Serverbatch-converter

U hebt mappen vol DOC- en DOCX-bestanden en u hebt de leesbare tekst-body nodig, niet de opmaak — voor full-text-indexering, zoekmachine-ingestie, NLP- en machine-learning-pipelines, eDiscovery-beoordeling of langdurige archivering. Elk bestand openen in Word en opslaan als platte tekst schaalt niet voorbij een handvol bestanden, en het laat Word-opmaakartefacten achter. Total Doc Converter X verwijdert Word-opmaak en schrijft schone UTF-8- of ANSI-tekst vanaf de opdrachtregel, in batch, zonder GUI en zonder dat een Microsoft Word-installatie nodig is. Installeer het op een Windows-server, roep het aan vanuit een script of via ActiveX, en laat het onbeheerd draaien.

Wat Total Doc Converter X doet

  • Batchconversie — geef een jokerteken op (*.docx) en de converter verwerkt elk overeenkomend bestand in één keer
  • Schone tekstuitvoer — verwijdert lettertypen, kleuren, alineastijlen, kop- en voetteksten, en laat alleen de leesbare tekst-body achter
  • Coderingsbeheer — schrijf UTF-8, UTF-16, ANSI of elke Windows-codepagina om aan te sluiten op uw downstream-pipeline
  • BOM-afhandeling — geef de UTF-8 byte-order mark uit of onderdruk hem om aan de eisen van zoekindexers en parsers te voldoen
  • Meertalige inhoud — behoudt Cyrillisch, CJK, Arabisch, Hebreeuws en elk Unicode-schrift dat de bron-DOC/DOCX bevat
  • Geen Word vereist — de converter parseert DOC en DOCX rechtstreeks zonder Microsoft Office op de server
  • Geen GUI — draait stil vanaf de opdrachtregel zonder pop-upvensters of bevestigingsdialogen
  • ActiveX / COM — roep de converter aan vanuit .NET, VBScript, PHP, Python of elke COM-compatibele omgeving om conversie in uw eigen applicatie in te bouwen
  • .bat-scripting — sla commando's op in batchbestanden en plan ze in met Windows Taakplanner voor volledig geautomatiseerde conversie

Word naar tekst opdrachtregel-conversie

Gratis proefversie downloaden

(30 dagen, geen e-mail)

Licentie kopen

(serverlicentie, eeuwigdurend)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022

Word vs tekst: waarom converteren?

DOC en DOCX zijn Microsoft Word-formaten gebouwd voor menselijke lezing en bewerking. Een DOCX-bestand is een ZIP-container met XML-onderdelen, ingesloten media, stijlen, revisiegeschiedenis, opmerkingen en bijgehouden wijzigingen. Een zoekmachine, een indexer, een LLM-tokenisator of een eDiscovery-pipeline geeft niets om dat alles — ze geven om de leesbare tekst. Die systemen op ruwe Word-bestanden richten dwingt elke consument zijn eigen DOC/DOCX-parser te leveren, en de parsers zijn het oneens over randgevallen.

TXT is de kleinste gemene deler. Elke zoekindexer, elke NLP-toolkit, elke grep-stijl-tool, elke diff-utility leest platte tekst op dezelfde manier. Word naar TXT converteren, eenmalig, op de server, geeft elke downstream-consument dezelfde schone invoer. Tabellen worden platgeslagen tot tab-gescheiden rijen of regeleinden. Afbeeldingen verdwijnen. Kop- en voetteksten kunnen worden behouden of verwijderd, afhankelijk van uw vlag. Wat overblijft is de body-inhoud, klaar voor indexering of feature-extractie.

DOC / DOCXTXT
InhoudTekst + opmaak + mediaAlleen tekst
BestandsgrootteTientallen tot honderden KBDoorgaans 5–20% van het origineel
IndexeringVereist DOC/DOCX-parserWerkt met elke indexer of tokenisator
TabellenGestructureerde cellenPlatgeslagen tot tab-gescheiden rijen
AfbeeldingenIngeslotenVerwijderd
DoelgroepReviewers, redacteurenZoeken, NLP, archivering, eDiscovery

Word naar tekst converteren vanaf de opdrachtregel

Stap 1. Installeer Total Doc Converter X

Download het installatieprogramma via de bovenstaande link en voer het uit op uw Windows-server of werkstation. De installatie duurt minder dan een minuut. Geen Microsoft Word-, LibreOffice- of browser-installatie is vereist — de converter parseert DOC en DOCX rechtstreeks met zijn eigen engine en schrijft platte tekst in de codering die u opgeeft.

Stap 2. Open de opdrachtprompt

Open cmd.exe of PowerShell. Het uitvoerbare bestand van de converter is DOCConverter.exe, te vinden in de installatiemap (meestal C:\Program Files\CoolUtils\TotalDocConverterX\). Voeg het toe aan uw systeem-PATH of gebruik het volledige pad in uw commando's.

Stap 3. Voer de basisconversie uit

Het eenvoudigste commando converteert alle DOCX-bestanden in een map naar TXT:

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8

Dit verwerkt elk .docx-bestand in C:\Docs\ en slaat de resulterende TXT-bestanden op in C:\Output\. Elk Word-bestand levert één TXT op met dezelfde basisnaam. Gebruik *.doc voor legacy Word 97–2003-documenten, of *.do* om beide tegelijk te vangen.

Stap 4. Voeg coderings- en logoptie's toe

Beheer de TXT-uitvoer met extra vlaggen:

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log
  • -Encoding UTF-8 — uitvoercodering (UTF-8, UTF-16, ANSI, 1251, 1252, enz.)
  • -BOM 0 — onderdruk de UTF-8 byte-order mark; gebruik -BOM 1 om hem te schrijven
  • -LineBreaks CRLF — Windows-stijl \r\n of LF voor Unix-stijl \n
  • -log C:\Logs\word2txt.log — schrijf een conversielog ter verificatie

Stap 5. Automatiseer met een .bat-bestand

Sla uw commando op in een .bat-bestand en plan het in met Windows Taakplanner:

@echo off
"C:\Program Files\CoolUtils\TotalDocConverterX\DOCConverter.exe" C:\Incoming\*.docx C:\Archive\TXT\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log

Dit voert de conversie elke nacht uit (of op elk interval dat u instelt) en schrijft een logbestand zodat u de resultaten kunt verifiëren. Koppel de uitvoermap aan uw zoekindexer of uw NLP-ingestion-taak en de pipeline draait van begin tot eind zonder handmatige stap.

ActiveX / COM-integratie

Total Doc Converter X bevat een volledige ActiveX-interface. U kunt de converter aanroepen vanuit elke COM-compatibele omgeving — .NET, VBScript, PHP, Python, Ruby of ASP. Hiermee kunt u Word-naar-tekst-conversie inbouwen in uw eigen webapplicatie, eDiscovery-platform of documentwerkstroom zonder een opdrachtregelproces te hoeven starten.

Voorbeeld (C#/.NET):

DOCConverterX Cnv = new DOCConverterX();
Cnv.Convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

Voorbeeld (PHP):

$c = new COM("DOCConverter.DOCConverterX");
$c->convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

Dezelfde aanroep werkt vanuit ASP.NET, VBScript, Python, Ruby, Perl en JavaScript (Windows Script Host). Uw webapplicatie kan geüploade Word-bestanden accepteren en in realtime schone UTF-8-tekst retourneren aan de indexer, het LLM-eindpunt of de opslaglaag.

Online converters vs Total Doc Converter X

FunctieOnline convertersTotal Doc Converter X
BatchverwerkingEén bestand tegelijkOnbeperkt aantal bestanden per batch
BestandsprivacyBestanden geüpload naar server van derdenBestanden verlaten nooit uw machine
CoderingsbeheerAlleen UTF-8, BOM geforceerdUTF-8, UTF-16, ANSI, codepagina's, BOM aan/uit
Meertalige inhoudInconsistent op CJK, RTL-schriftenVolledige Unicode behouden
AutomatiseringAlleen handmatigOpdrachtregel, .bat, Taakplanner, ActiveX
ServerimplementatieNiet mogelijkOntworpen voor servers, geen GUI nodig
Vereist Word geïnstalleerdN.v.t.Nee
Vereist internetJaNee

Wanneer u Word naar tekst opdrachtregel-conversie nodig hebt

  • Full-text-zoekindexering. Een zakelijke zoekmachine indexeert een gedeelde bedrijfsdocumenten-share. Hem op ruwe DOCX-bestanden richten dwingt hem zijn eigen parser te leveren; hem op TXT-bestanden richten laat elke indexer (Elasticsearch, Solr, Sphinx, Manticore) de inhoud rechtstreeks lezen. De converter bereidt het corpus eenmalig voor, de indexer neemt het voor altijd op.
  • Contracten voeden aan een LLM- of ML-pipeline. Tokenisatoren en embedding-modellen werken op platte tekst. Een nachtelijke taak converteert nieuwe contracten naar TXT en duwt ze naar de embedding-store, waar een retrieval-augmented-model vragen kan beantwoorden over clausule-taal zonder te stikken in Word-XML.
  • Juridische tekst-mining en eDiscovery. Een team voor procesondersteuning heeft de tekstuele body nodig van duizenden DOC- en DOCX-bewijsstukken voor trefwoordzoekopdrachten, conceptclustering en voorspellende codering. Platte tekst is het invoerformaat dat elke eDiscovery-tool op dezelfde manier begrijpt.
  • E-mail- en logbehoud voor compliance. Outlook exporteert e-mailbodies als DOCX. Compliance-archieven hebben platte-tekstkopieën nodig die elke auditor over twintig jaar kan lezen zonder een Word-installatie. De converter verwijdert de Word-wrapper en slaat schone TXT op naast het origineel.
  • NLP-feature-extractie. Sentiment-scoring, named-entity-recognition en topic-modellering draaien op token-streams. De bron-DOCX eenmalig naar UTF-8 TXT converteren betekent dat de NLP-pipeline hetzelfde document niet bij elke draai opnieuw parseert.
  • Langdurige archivering. Word-formaten evolueren. Een DOC uit 2001 heeft al een compatibiliteitsshim nodig. Platte UTF-8-tekst zal in 2050 nog steeds in elke editor openen. De leesbare body archiveren naast het origineel is goedkope verzekering.

Waarom Total Doc Converter X

Geen Word vereist

De converter parseert DOC en DOCX rechtstreeks. U hebt geen Microsoft Office, LibreOffice of welke tekstverwerker dan ook nodig op de server. Dit voorkomt licentiekosten en de bekende instabiliteit van het automatiseren van Word in onbeheerde scenario's.

Echte serverapplicatie

Total Doc Converter X is ontworpen voor onbeheerd gebruik. Geen GUI-vensters, geen dialoogvensters, geen bevestigingsprompts. Het draait stil vanaf de opdrachtregel of als onderdeel van een dienst — precies wat een productieserver nodig heeft.

Codering die past bij uw pipeline

Zoekindexers, NLP-frameworks en legacy-archieven hebben elk hun eigen coderingsregels. Total Doc Converter X schrijft UTF-8 met of zonder BOM, UTF-16 LE of BE, Windows ANSI-codepagina's 1251 en 1252, en elke andere codepagina die op het systeem is geregistreerd. Cyrillische contracten, Japanse producthandleidingen, Arabische correspondentie en Duitse technische documentatie overleven allemaal de conversie intact — de converter leest de bron-DOC/DOCX als Unicode en schrijft de gekozen uitvoercodering zonder verlieslatende transliteratie. Stel -Encoding eenmalig in uw .bat-bestand in en de uitvoer komt byte voor byte overeen met downstream-consumenten.

Niet alleen TXT

Dezelfde opdrachtregeltool converteert Word naar PDF, HTML, RTF, XLS, TIFF, JPEG en meer. Eén installatie dekt al uw Word-conversiebehoeften. Verander -c TXT in -c PDF en u krijgt PDF-uitvoer met dezelfde batch- en automatiseringsfuncties.

Gratis proefversie downloaden

(30 dagen, geen e-mail of creditcard)

Licentie kopen

(serverlicentie, eeuwigdurend)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022


quote

Total Doc Converter X — serveroplossing voor documentconversie Klantenbeoordelingen 2026

Beoordeel Het
Beoordeeld als 4.7/5 op basis van klantbeoordelingen
5 Star

"We verwerken enkele duizenden DOC- en DOCX-bewijsstukken per zaak. Total Doc Converter X draait als nachtelijke batch op de eDiscovery-server en produceert UTF-8-tekstkopieën voor trefwoordzoekopdrachten en conceptclustering. De tekst-body is schoon — geen Word-artefacten, geen kop/voet-ruis, tabellen platgeslagen tot tabs. -BOM 0 instellen was het kleine detail dat onze indexer in één keer tevreden stelde."

5 Star Caroline Whitford Litigation Support Specialist, Mid-Atlantic Law Group

"We voeden contractcorpora in een embedding-pipeline voor retrieval-augmented zoeken. DOCX parseren binnen de pipeline was traag en broos, en python-docx was het oneens met Word over tabelcellen. Vooraf converteren naar platte TXT met DOCConverter.exe verwijderde beide problemen. Het .bat-bestand leeft in Taakplanner, de embedding-taak leest TXT, en we stopten met vechten tegen Word-XML."

5 Star Devansh Iyer NLP Engineer

"Compliance vroeg ons om platte-tekstkopieën van elk klinisch document naast de originelen te bewaren voor langdurige archivering. We kozen Total Doc Converter X omdat het geen Word op de bestandsserver nodig heeft, en de coderingsvlag liet ons standaardiseren op UTF-8 zonder BOM in het hele archief. Documentatie zou gedetailleerder kunnen zijn over de tabel-platslaan-regels, maar support beantwoordde onze vragen dezelfde dag."

4 Star Margaret Holloway Records Manager, Regional Health Network

FAQ ▼

Het basiscommando is: DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8. Dit converteert elk Word-bestand in de bronmap naar TXT. Gebruik *.doc voor legacy Word 97–2003-bestanden, of *.do* om DOC en DOCX in één keer te vangen.
Geef -Encoding op gevolgd door de doelcodering. Ondersteunde waarden zijn onder andere UTF-8, UTF-16, UTF-16BE, ANSI en elke Windows-codepagina die op het systeem is geregistreerd (bijvoorbeeld 1251 voor Cyrillisch Windows of 1252 voor West-Europees). De uitvoerbytes komen exact overeen met wat de downstream-indexer of -parser verwacht.
Ja. Voeg -BOM 0 toe om een schone UTF-8-stream zonder byte-order mark te schrijven. Gebruik -BOM 1 om de BOM uit te geven. Sommige zoekindexers en JSON-parsers verwerpen bestanden die met een BOM beginnen, terwijl sommige Windows-native tools hem vereisen — de vlag laat u beide kanten opzoeken zonder nabewerking.
Ja. De bron-DOC of -DOCX wordt als Unicode gelezen, dus Cyrillisch, Grieks, Arabisch, Hebreeuws, Chinees, Japans, Koreaans en Indische schriften komen allemaal intact in de uitvoer aan. Kies -Encoding UTF-8 voor volledige Unicode-dekking in één byte-stream, of kies een codepagina als uw archiefstandaard er een vereist.
Tabellen worden platgeslagen tot tekst. Elke rij wordt een regel; cellen binnen een rij worden standaard gescheiden door tabs. Dit produceert een TSV-achtige lay-out die elke spreadsheet, indexer of pandas-reader kan parseren. De kolomstructuur van de oorspronkelijke tabel blijft behouden zolang uw downstream-tool tab-gescheiden waarden begrijpt.
Standaard worden kop- en voetteksten één keer per document opgenomen, niet herhaald op elke pagina, zodat de tekst-body schoon blijft. Gebruik -IncludeHeaders 0 om ze volledig te verwijderen, of -IncludeHeaders 1 om ze te behouden. Paginanummers worden verwijderd omdat TXT geen concept van pagina's heeft.
Ja. Total Doc Converter X registreert zich als een COM/ActiveX-object (DOCConverter.DOCConverterX). U kunt het aanroepen vanuit .NET, PHP, Python, VBScript, ASP, Ruby, Perl en elke andere COM-compatibele omgeving. Uw webapplicatie kan geüploade DOC/DOCX-bestanden accepteren en in realtime UTF-8-tekst retourneren aan de indexer of het LLM-eindpunt.

Voorbeelden van Total Doc Converter X

Doc-bestanden converteren met Total Doc Converter X en .NET


string src  = @"C:\test\Source.docx";
string dest = @"C:\test\Dest.pdf";

var cnv = new DocConverterX();
cnv.Convert(src, dest, "-cPDF -log c:\\test\\Doc.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

Doc-bestanden converteren op webservers met Total Doc Converter X

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\DocConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.docx";
                var outPath = Path.GetTempFileName() + ".pdf";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cPDF";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
Meer informatie over Azure Functions.

Doc-bestanden converteren op webservers met Total Doc Converter X

dim C
Set C=CreateObject("DocConverter.DocConverterX")
C.Convert "c:\source.docx", "c:\dest.pdf", "-cPDF -log c:\doc.log"
Response.Write C.ErrorMessage
set C = nothing

De resulterende PDF rechtstreeks vanuit ASP streamen

dim C
Set C=CreateObject("DocConverter.DocConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.docx", "C:\www\ASP", "-cpdf -log c:\doc.log")
set C = nothing

Doc-bestanden converteren met PHP en Total Doc Converter X

$src="C:\\test\\test.docx";
$dest="C:\\test\\test.pdf";
if (file_exists($dest)) unlink($dest);
$c= new COM("DocConverter.DocConverterX");
$c->convert($src,$dest, "-cPDF -log c:\\test\\Doc.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

Doc-bestanden converteren met Total Doc Converter X en Ruby

require 'win32ole'
c = WIN32OLE.new('DocConverter.DocConverterX')

src = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

Doc-bestanden converteren met Total Doc Converter X en Python

import win32com.client
import os.path

c = win32com.client.Dispatch("DocConverter.DocConverterX")

src  = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

Doc-bestanden converteren met Pascal en Total Doc Converter X

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('DocConverter.DocConverterX');
  c.Convert('c:\test\source.docx', 'c:\test\dest.pdf', '-cPDF -log c:\test\Doc.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

Doc-bestanden converteren op webservers met Total Doc Converter X

var c = new ActiveXObject("DocConverter.DocConverterX");
c.Convert("C:\\test\\source.docx", "C:\\test\\dest.pdf", "-cPDF");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

Doc-bestanden converteren met Total Doc Converter X en Perl

use Win32::OLE;

my $src  = "C:\\test\\test.docx";
my $dest = "C:\\test\\test.pdf";

my $c = CreateObject Win32::OLE 'DocConverter.DocConverterX';
$c->convert($src, $dest, "-cPDF -log c:\\test\\Doc.log");
print $c->ErrorMessage if -e $dest;

Begin nu met werken!

Download de gratis proefversie en converteer uw bestanden in enkele minuten.
Geen creditcard of e-mail vereist.

⬇ Gratis proefversie downloaden Windows 7/8/10/11 • 135 MB

Support
Total Doc Converter X — serveroplossing voor documentconversie Preview1

Laatste Nieuws

Nieuwsbiefabonnement

Maak u geen zorgen, we spammen niet.


© 2026. Alle rechten voorbehouden. CoolUtils File Converters

Cards