Logo
Accueil Produits Support Contact À propos de nous
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware


Convertir Word en texte via la ligne de commande — Convertisseur serveur par lots

Vous avez des dossiers de fichiers DOC et DOCX et vous avez besoin du corps de texte lisible, pas de la mise en forme — pour l'indexation plein texte, l'ingestion par moteur de recherche, les pipelines NLP et de machine learning, la revue eDiscovery ou l'archivage à long terme. Ouvrir chaque fichier dans Word et l'enregistrer en texte brut ne passe pas l'échelle au-delà d'une poignée de fichiers, et cela laisse des artefacts de mise en forme Word. Total Doc Converter X supprime la mise en forme Word et écrit du texte UTF-8 ou ANSI propre depuis la ligne de commande, en lot, sans interface graphique et sans installation de Microsoft Word. Installez-le sur un serveur Windows, appelez-le depuis un script ou via ActiveX, et laissez-le fonctionner de manière autonome.

Ce que fait Total Doc Converter X

  • Conversion par lots — passez un caractère générique (*.docx) et le convertisseur traite chaque fichier correspondant en une seule exécution
  • Sortie texte propre — supprime polices, couleurs, styles de paragraphe, en-têtes et pieds de page, ne laissant que le corps de texte lisible
  • Contrôle de l'encodage — écrit UTF-8, UTF-16, ANSI ou toute page de codes Windows pour correspondre à votre pipeline en aval
  • Gestion du BOM — émettre ou supprimer la marque d'ordre des octets UTF-8 pour correspondre aux exigences des indexeurs et parsers de recherche
  • Contenu multilingue — préserve cyrillique, CJK, arabe, hébreu et tout script Unicode que la source DOC/DOCX contient
  • Sans Word requis — le convertisseur analyse DOC et DOCX directement sans Microsoft Office sur le serveur
  • Sans interface graphique — fonctionne silencieusement depuis la ligne de commande sans fenêtres contextuelles ni boîtes de dialogue de confirmation
  • ActiveX / COM — appelez le convertisseur depuis .NET, VBScript, PHP, Python ou tout environnement compatible COM pour intégrer la conversion dans votre propre application
  • Scripts .bat — enregistrez les commandes dans des fichiers batch et planifiez-les avec le Planificateur de tâches Windows pour une conversion entièrement automatisée

Conversion Word en texte en ligne de commande

Télécharger l'essai gratuit

(30 jours, sans e-mail)

Acheter une licence

(licence serveur, perpétuelle)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022

Word vs texte : pourquoi convertir ?

DOC et DOCX sont des formats Microsoft Word conçus pour la lecture et l'édition humaines. Un fichier DOCX est un conteneur ZIP avec des parties XML, des médias intégrés, des styles, un historique des révisions, des commentaires et des modifications suivies. Un moteur de recherche, un indexeur, un tokenizer LLM ou un pipeline eDiscovery ne se soucie de rien de tout cela — il se soucie du texte lisible. Pointer ces systèmes vers des fichiers Word bruts force chaque consommateur à embarquer son propre parser DOC/DOCX, et les parsers sont en désaccord sur les cas particuliers.

TXT est le plus petit dénominateur commun. Tout indexeur de recherche, toute boîte à outils NLP, tout outil de type grep, tout utilitaire de diff lit le texte brut de la même manière. Convertir Word en TXT une fois, sur le serveur, donne à chaque consommateur en aval la même entrée propre. Les tableaux s'aplatissent en lignes séparées par tabulations ou en sauts de ligne. Les images disparaissent. Les en-têtes et pieds de page peuvent être conservés ou supprimés, selon votre indicateur. Ce qui reste est le contenu du corps, prêt pour l'indexation ou l'extraction de caractéristiques.

DOC / DOCXTXT
ContenuTexte + mise en forme + médiasTexte uniquement
Taille de fichierDizaines à centaines de KoGénéralement 5–20 % de l'original
IndexationNécessite un parser DOC/DOCXFonctionne avec tout indexeur ou tokenizer
TableauxCellules structuréesAplatis en lignes séparées par tabulations
ImagesIntégréesSupprimées
PublicRelecteurs, éditeursRecherche, NLP, archivage, eDiscovery

Comment convertir Word en texte depuis la ligne de commande

Étape 1. Installer Total Doc Converter X

Téléchargez l'installateur depuis le lien ci-dessus et lancez-le sur votre serveur ou poste de travail Windows. L'installation prend moins d'une minute. Aucune installation de Microsoft Word, LibreOffice ou navigateur n'est requise — le convertisseur analyse DOC et DOCX directement avec son propre moteur, et écrit du texte brut dans l'encodage que vous spécifiez.

Étape 2. Ouvrir l'invite de commandes

Ouvrez cmd.exe ou PowerShell. L'exécutable du convertisseur est DOCConverter.exe, situé dans le dossier d'installation (généralement C:\Program Files\CoolUtils\TotalDocConverterX\). Ajoutez-le à votre PATH système ou utilisez le chemin complet dans vos commandes.

Étape 3. Exécuter la conversion de base

La commande la plus simple convertit tous les fichiers DOCX d'un dossier en TXT :

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8

Cela traite chaque fichier .docx dans C:\Docs\ et enregistre les fichiers TXT résultants dans C:\Output\. Chaque fichier Word produit un TXT avec le même nom de base. Utilisez *.doc pour les documents Word 97–2003 anciens, ou *.do* pour capturer les deux à la fois.

Étape 4. Ajouter des options d'encodage et de journalisation

Contrôlez la sortie TXT avec des indicateurs supplémentaires :

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log
  • -Encoding UTF-8 — encodage de sortie (UTF-8, UTF-16, ANSI, 1251, 1252, etc.)
  • -BOM 0 — supprimer la marque d'ordre des octets UTF-8 ; utilisez -BOM 1 pour l'écrire
  • -LineBreaks CRLF — style Windows \r\n ou LF pour le style Unix \n
  • -log C:\Logs\word2txt.log — écrire un journal de conversion pour vérification

Étape 5. Automatiser avec un fichier .bat

Enregistrez votre commande dans un fichier .bat et planifiez-la avec le Planificateur de tâches Windows :

@echo off
"C:\Program Files\CoolUtils\TotalDocConverterX\DOCConverter.exe" C:\Incoming\*.docx C:\Archive\TXT\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log

Cela exécute la conversion chaque nuit (ou à l'intervalle que vous définissez) et écrit un fichier journal pour que vous puissiez vérifier les résultats. Associez le dossier de sortie à votre indexeur de recherche ou à votre tâche d'ingestion NLP et le pipeline s'exécute de bout en bout sans étape manuelle.

Intégration ActiveX / COM

Total Doc Converter X inclut une interface ActiveX complète. Vous pouvez appeler le convertisseur depuis tout environnement compatible COM — .NET, VBScript, PHP, Python, Ruby ou ASP. Cela vous permet d'intégrer la conversion Word vers texte dans votre propre application web, plateforme eDiscovery ou flux de travail documentaire sans passer par un processus en ligne de commande.

Exemple (C#/.NET) :

DOCConverterX Cnv = new DOCConverterX();
Cnv.Convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

Exemple (PHP) :

$c = new COM("DOCConverter.DOCConverterX");
$c->convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

Le même appel fonctionne depuis ASP.NET, VBScript, Python, Ruby, Perl et JavaScript (Windows Script Host). Votre application web peut accepter des fichiers Word téléchargés et renvoyer du texte UTF-8 propre à l'indexeur, au point de terminaison LLM ou à la couche de stockage en temps réel.

Convertisseurs en ligne vs Total Doc Converter X

FonctionnalitéConvertisseurs en ligneTotal Doc Converter X
Traitement par lotsUn fichier à la foisFichiers illimités par lot
Confidentialité des fichiersFichiers envoyés sur un serveur tiersLes fichiers ne quittent jamais votre machine
Contrôle de l'encodageUTF-8 uniquement, BOM forcéUTF-8, UTF-16, ANSI, pages de codes, BOM activé/désactivé
Contenu multilingueIncohérent sur CJK, scripts RTLUnicode complet préservé
AutomatisationManuelle uniquementLigne de commande, .bat, Planificateur de tâches, ActiveX
Déploiement serveurImpossibleConçu pour les serveurs, sans interface graphique
Nécessite Word installéN/ANon
Nécessite InternetOuiNon

Quand avez-vous besoin de la conversion Word en texte en ligne de commande

  • Indexation plein texte. Un moteur de recherche d'entreprise indexe un partage de documents corporatif. Le pointer vers des fichiers DOCX bruts le force à embarquer son propre parser ; le pointer vers des fichiers TXT permet à tout indexeur (Elasticsearch, Solr, Sphinx, Manticore) de lire le contenu directement. Le convertisseur prépare le corpus une fois, l'indexeur ingère indéfiniment.
  • Alimenter des contrats à un LLM ou pipeline ML. Tokenizers et modèles d'embedding fonctionnent sur du texte brut. Une tâche nocturne convertit les nouveaux contrats en TXT et les pousse vers le store d'embeddings, où un modèle augmenté par récupération peut répondre à des questions sur le langage des clauses sans s'étouffer sur du XML Word.
  • Fouille de texte juridique et eDiscovery. Une équipe de support contentieux a besoin du corps textuel de milliers de pièces à conviction DOC et DOCX pour la recherche par mot-clé, le clustering conceptuel et le codage prédictif. Le texte brut est le format d'entrée que tout outil eDiscovery comprend de la même manière.
  • Préservation des e-mails et journaux pour la conformité. Outlook exporte les corps d'e-mails en DOCX. Les archives de conformité ont besoin de copies en texte brut que tout auditeur peut lire dans vingt ans sans installation de Word. Le convertisseur supprime l'enveloppe Word et stocke du TXT propre aux côtés de l'original.
  • Extraction de caractéristiques NLP. Le scoring de sentiment, la reconnaissance d'entités nommées et la modélisation de sujets fonctionnent sur des flux de tokens. Convertir le DOCX source en TXT UTF-8 une fois signifie que le pipeline NLP ne re-parse pas le même document à chaque exécution.
  • Archivage à long terme. Les formats Word évoluent. Un DOC de 2001 a déjà besoin d'un shim de compatibilité. Le texte UTF-8 brut s'ouvrira toujours dans tout éditeur en 2050. Archiver le corps lisible aux côtés de l'original est une assurance peu coûteuse.

Pourquoi Total Doc Converter X

Aucun Word requis

Le convertisseur analyse DOC et DOCX directement. Vous n'avez pas besoin de Microsoft Office, LibreOffice ou de tout autre traitement de texte installé sur le serveur. Cela évite les coûts de licence et l'instabilité bien connue de l'automatisation de Word dans des scénarios sans surveillance.

Véritable application serveur

Total Doc Converter X est conçu pour un usage sans surveillance. Pas de fenêtres d'interface graphique, pas de boîtes de dialogue, pas de demandes de confirmation. Il fonctionne silencieusement depuis la ligne de commande ou dans le cadre d'un service — exactement ce dont un serveur de production a besoin.

Encodage qui correspond à votre pipeline

Indexeurs de recherche, frameworks NLP et archives anciennes ont chacun leurs propres règles d'encodage. Total Doc Converter X écrit en UTF-8 avec ou sans BOM, UTF-16 LE ou BE, pages de codes Windows ANSI 1251 et 1252, et toute autre page de codes enregistrée sur le système. Contrats cyrilliques, manuels de produits japonais, correspondance arabe et documentation technique allemande survivent tous à la conversion intacts — le convertisseur lit la source DOC/DOCX comme Unicode et écrit l'encodage de sortie choisi sans translittération avec perte. Définissez -Encoding une fois dans votre fichier .bat et la sortie correspond aux consommateurs en aval octet pour octet.

Pas seulement TXT

Le même outil en ligne de commande convertit Word en PDF, HTML, RTF, XLS, TIFF, JPEG et bien d'autres formats. Une seule installation couvre tous vos besoins de conversion Word. Changez -c TXT en -c PDF et vous obtenez une sortie PDF avec les mêmes fonctionnalités de traitement par lots et d'automatisation.

Télécharger l'essai gratuit

(30 jours, sans e-mail ni carte bancaire)

Acheter une licence

(licence serveur, perpétuelle)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022


quote

Convertisseur de documents DOC pour serveurs Avis des clients 2026

Évaluez-le
Noté 4.7/5 sur la base des avis des clients
5 Star

"Nous traitons plusieurs milliers de pièces à conviction DOC et DOCX par dossier. Total Doc Converter X s'exécute comme un lot nocturne sur le serveur eDiscovery et produit des copies de texte UTF-8 pour la recherche par mot-clé et le clustering conceptuel. Le corps de texte est propre — pas d'artefacts Word, pas de bruit d'en-tête/pied de page, tableaux aplatis en tabulations. Définir -BOM 0 a été le petit détail qui a satisfait notre indexeur dès le premier essai."

5 Star Caroline Whitford Litigation Support Specialist, Mid-Atlantic Law Group

"Nous alimentons des corpus de contrats dans un pipeline d'embedding pour la recherche augmentée par récupération. Parser le DOCX dans le pipeline était lent et fragile, et python-docx était en désaccord avec Word sur les cellules de tableau. Pré-convertir en TXT brut avec DOCConverter.exe a supprimé les deux problèmes. Le fichier .bat vit dans le Planificateur de tâches, la tâche d'embedding lit le TXT et nous avons cessé de nous battre avec le XML Word."

5 Star Devansh Iyer NLP Engineer

"La conformité nous a demandé de conserver des copies en texte brut de chaque document clinique aux côtés des originaux pour l'archivage à long terme. Nous avons choisi Total Doc Converter X parce qu'il n'a pas besoin de Word sur le serveur de fichiers, et l'indicateur d'encodage nous a permis de standardiser sur UTF-8 sans BOM dans toute l'archive. La documentation pourrait être plus détaillée sur les règles d'aplatissement des tableaux, mais le support a répondu à nos questions le jour même."

4 Star Margaret Holloway Records Manager, Regional Health Network

FAQ ▼

La commande de base est : DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8. Cela convertit chaque fichier Word du dossier source en TXT. Utilisez *.doc pour les fichiers Word 97–2003 anciens, ou *.do* pour capturer DOC et DOCX en une seule exécution.
Passez -Encoding suivi de l'encodage cible. Les valeurs prises en charge incluent UTF-8, UTF-16, UTF-16BE, ANSI et toute page de codes Windows enregistrée sur le système (par exemple 1251 pour le Windows cyrillique ou 1252 pour l'Europe occidentale). Les octets de sortie correspondent exactement à ce que l'indexeur ou le parser en aval attend.
Oui. Ajoutez -BOM 0 pour écrire un flux UTF-8 propre sans marque d'ordre des octets. Utilisez -BOM 1 pour émettre le BOM. Certains indexeurs de recherche et parsers JSON rejettent les fichiers commençant par un BOM, tandis que certains outils natifs Windows le requièrent — l'indicateur vous permet de correspondre à l'un ou l'autre côté sans post-traitement.
Oui. Le DOC ou DOCX source est lu comme Unicode, donc cyrillique, grec, arabe, hébreu, chinois, japonais, coréen et scripts indiens atteignent tous la sortie intacts. Choisissez -Encoding UTF-8 pour une couverture Unicode complète dans un seul flux d'octets, ou choisissez une page de codes si votre standard d'archive en requiert une.
Les tableaux sont aplatis en texte. Chaque ligne devient une ligne ; les cellules d'une ligne sont séparées par des tabulations par défaut. Cela produit une mise en page de type TSV que tout tableur, indexeur ou lecteur pandas peut analyser. La structure des colonnes du tableau d'origine est préservée tant que votre outil en aval comprend les valeurs séparées par tabulations.
Par défaut, les en-têtes et pieds de page sont inclus une fois par document, pas répétés sur chaque page, pour que le corps de texte reste propre. Utilisez -IncludeHeaders 0 pour les supprimer entièrement, ou -IncludeHeaders 1 pour les conserver. Les numéros de page sont supprimés car le TXT n'a pas de notion de pages.
Oui. Total Doc Converter X s'enregistre en tant qu'objet COM/ActiveX (DOCConverter.DOCConverterX). Vous pouvez l'appeler depuis .NET, PHP, Python, VBScript, ASP, Ruby, Perl et tout autre environnement compatible COM. Votre application web peut accepter des fichiers DOC/DOCX téléchargés et renvoyer du texte UTF-8 à l'indexeur ou au point de terminaison LLM en temps réel.

Exemples d'utilisation de Total Doc Converter X

Convertir des fichiers Doc avec Total Doc Converter X et .NET


string src  = @"C:\test\Source.docx";
string dest = @"C:\test\Dest.pdf";

var cnv = new DocConverterX();
cnv.Convert(src, dest, "-cPDF -log c:\\test\\Doc.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

Convertir des fichiers Doc sur des serveurs web avec Total Doc Converter X

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\DocConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.docx";
                var outPath = Path.GetTempFileName() + ".pdf";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cPDF";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
Plus d'informations sur Azure Functions.

Convertir des fichiers Doc sur des serveurs web avec Total Doc Converter X

dim C
Set C=CreateObject("DocConverter.DocConverterX")
C.Convert "c:\source.docx", "c:\dest.pdf", "-cPDF -log c:\doc.log"
Response.Write C.ErrorMessage
set C = nothing

Diffuser le PDF résultant directement depuis ASP

dim C
Set C=CreateObject("DocConverter.DocConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.docx", "C:\www\ASP", "-cpdf -log c:\doc.log")
set C = nothing

Convertir des fichiers Doc avec PHP et Total Doc Converter X

$src="C:\\test\\test.docx";
$dest="C:\\test\\test.pdf";
if (file_exists($dest)) unlink($dest);
$c= new COM("DocConverter.DocConverterX");
$c->convert($src,$dest, "-cPDF -log c:\\test\\Doc.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

Convertir des fichiers Doc avec Total Doc Converter X et Ruby

require 'win32ole'
c = WIN32OLE.new('DocConverter.DocConverterX')

src = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

Convertir des fichiers Doc avec Total Doc Converter X et Python

import win32com.client
import os.path

c = win32com.client.Dispatch("DocConverter.DocConverterX")

src  = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

Convertir des fichiers Doc avec Pascal et Total Doc Converter X

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('DocConverter.DocConverterX');
  c.Convert('c:\test\source.docx', 'c:\test\dest.pdf', '-cPDF -log c:\test\Doc.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

Convertir des fichiers Doc sur des serveurs web avec Total Doc Converter X

var c = new ActiveXObject("DocConverter.DocConverterX");
c.Convert("C:\\test\\source.docx", "C:\\test\\dest.pdf", "-cPDF");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

Convertir des fichiers Doc avec Total Doc Converter X et Perl

use Win32::OLE;

my $src  = "C:\\test\\test.docx";
my $dest = "C:\\test\\test.pdf";

my $c = CreateObject Win32::OLE 'DocConverter.DocConverterX';
$c->convert($src, $dest, "-cPDF -log c:\\test\\Doc.log");
print $c->ErrorMessage if -e $dest;

Commencez à travailler maintenant!

Téléchargez la version d'essai gratuite et convertissez vos fichiers en quelques minutes.
Aucune carte de crédit ou email requis.

⬇ Télécharger la version d'essai gratuite Windows 7/8/10/11 • 135 MB

Support
Convertisseur de documents DOC pour serveurs Preview1

Dernières nouvelles

S'abonner à la newsletter

Ne vous inquiétez pas, nous ne spammons pas.


© 2026. Tous droits réservés. CoolUtils File Converters

Cards