Logo
Home Prodotti Supporto Contatti Chi siamo
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware

Convertire Word in testo da riga di comando — Convertitore batch per server

Hai cartelle di file DOC e DOCX e ti serve il corpo testuale leggibile, non la formattazione — per l’indicizzazione full-text, l’ingestione nei motori di ricerca, le pipeline NLP e di machine learning, la revisione eDiscovery o l’archiviazione a lungo termine. Aprire ogni file in Word e salvarlo come testo semplice non scala oltre una manciata di file, e lascia dietro artefatti di formattazione di Word. Total Doc Converter X rimuove la formattazione Word e scrive testo UTF-8 o ANSI pulito dalla riga di comando, in batch, senza GUI e senza richiedere l’installazione di Microsoft Word. Installalo su un server Windows, richiamalo da uno script o tramite ActiveX, e lascialo funzionare in modo automatico.

Cosa fa Total Doc Converter X

  • Conversione batch — passa un carattere jolly (*.docx) e il convertitore elabora ogni file corrispondente in un’unica esecuzione
  • Output di testo pulito — rimuove font, colori, stili di paragrafo, intestazioni e piè di pagina, lasciando solo il corpo testuale leggibile
  • Controllo della codifica — scrive UTF-8, UTF-16, ANSI o qualsiasi code page Windows per adattarsi alla tua pipeline a valle
  • Gestione del BOM — emette o sopprime il byte order mark UTF-8 per soddisfare i requisiti di indicizzatori e parser
  • Contenuto multilingue — preserva cirillico, CJK, arabo, ebraico e qualsiasi script Unicode contenuto nel DOC/DOCX di origine
  • Word non necessario — il convertitore analizza DOC e DOCX direttamente senza Microsoft Office sul server
  • Nessuna GUI — funziona silenziosamente dalla riga di comando senza finestre pop-up o dialoghi di conferma
  • ActiveX / COM — richiama il convertitore da .NET, VBScript, PHP, Python o qualsiasi ambiente compatibile COM per integrare la conversione nella tua applicazione
  • Scripting .bat — salva i comandi in file batch e programmali con l’Utilità di pianificazione di Windows per una conversione completamente automatizzata

Conversione Word in testo da riga di comando

Scarica la prova gratuita

(30 giorni, nessuna email)

Acquista licenza

(licenza server, perpetua)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022

Word vs testo: perché convertire?

DOC e DOCX sono formati Microsoft Word costruiti per la lettura e la modifica umana. Un file DOCX è un container ZIP con parti XML, media incorporati, stili, cronologia delle revisioni, commenti e modifiche tracciate. Un motore di ricerca, un indicizzatore, un tokenizer LLM o una pipeline eDiscovery non si curano di nulla di tutto ciò — si curano del testo leggibile. Puntare quei sistemi su file Word grezzi costringe ogni consumatore a portarsi il proprio parser DOC/DOCX, e i parser non sono d’accordo sui casi limite.

TXT è il minimo comune denominatore. Ogni indicizzatore di ricerca, ogni toolkit NLP, ogni strumento in stile grep, ogni utility diff legge il testo semplice nello stesso modo. Convertire Word in TXT una volta, sul server, fornisce a ogni consumatore a valle lo stesso input pulito. Le tabelle si appiattiscono in righe separate da tabulazioni o interruzioni di riga. Le immagini cadono. Intestazioni e piè di pagina possono essere mantenuti o rimossi, a seconda del tuo flag. Ciò che resta è il contenuto del corpo, pronto per l’indicizzazione o l’estrazione di feature.

DOC / DOCXTXT
ContenutoTesto + formattazione + mediaSolo testo
Dimensione del fileDecine o centinaia di KBTipicamente 5–20% dell’originale
IndicizzazioneRichiede un parser DOC/DOCXFunziona con qualsiasi indicizzatore o tokenizer
TabelleCelle strutturateAppiattite in righe separate da tabulazioni
ImmaginiIncorporateRimosse
PubblicoRevisori, editorRicerca, NLP, archiviazione, eDiscovery

Come convertire Word in testo dalla riga di comando

Passo 1. Installare Total Doc Converter X

Scarica il programma di installazione dal link qui sopra ed eseguilo sul tuo server o workstation Windows. L’installazione richiede meno di un minuto. Non è necessario installare Microsoft Word, LibreOffice o un browser — il convertitore analizza DOC e DOCX direttamente usando il proprio motore, e scrive testo semplice nella codifica che specifichi.

Passo 2. Aprire il prompt dei comandi

Apri cmd.exe o PowerShell. L’eseguibile del convertitore è DOCConverter.exe, situato nella cartella di installazione (tipicamente C:\Program Files\CoolUtils\TotalDocConverterX\). Aggiungilo al PATH di sistema o usa il percorso completo nei tuoi comandi.

Passo 3. Eseguire la conversione base

Il comando più semplice converte tutti i file DOCX in una cartella in TXT:

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8

Questo elabora ogni file .docx in C:\Docs\ e salva i file TXT risultanti in C:\Output\. Ogni file Word produce un TXT con lo stesso nome base. Usa *.doc per documenti Word 97–2003 legacy, oppure *.do* per catturare entrambi in una sola volta.

Passo 4. Aggiungere opzioni di codifica e log

Controlla l’output TXT con flag aggiuntivi:

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log
  • -Encoding UTF-8 — codifica di output (UTF-8, UTF-16, ANSI, 1251, 1252, ecc.)
  • -BOM 0 — sopprime il byte order mark UTF-8; usa -BOM 1 per scriverlo
  • -LineBreaks CRLF — stile Windows \r\n oppure LF per stile Unix \n
  • -log C:\Logs\word2txt.log — scrive un log di conversione per la verifica

Passo 5. Automatizzare con un file .bat

Salva il comando in un file .bat e programmalo con l’Utilità di pianificazione di Windows:

@echo off
"C:\Program Files\CoolUtils\TotalDocConverterX\DOCConverter.exe" C:\Incoming\*.docx C:\Archive\TXT\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log

Questo esegue la conversione ogni notte (o all’intervallo che preferisci) e scrive un file di log per verificare i risultati. Abbina la cartella di output al tuo indicizzatore di ricerca o al tuo job di ingestione NLP e la pipeline gira end-to-end senza alcun passaggio manuale.

Integrazione ActiveX / COM

Total Doc Converter X include un’interfaccia ActiveX completa. Puoi richiamare il convertitore da qualsiasi ambiente compatibile COM — .NET, VBScript, PHP, Python, Ruby o ASP. Questo ti permette di integrare la conversione da Word a testo nella tua applicazione web, piattaforma eDiscovery o flusso di lavoro documentale senza ricorrere a un processo da riga di comando.

Esempio (C#/.NET):

DOCConverterX Cnv = new DOCConverterX();
Cnv.Convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

Esempio (PHP):

$c = new COM("DOCConverter.DOCConverterX");
$c->convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

La stessa chiamata funziona da ASP.NET, VBScript, Python, Ruby, Perl e JavaScript (Windows Script Host). La tua applicazione web può accettare file Word caricati e restituire testo UTF-8 pulito all’indicizzatore, all’endpoint LLM o al livello di storage in tempo reale.

Convertitori online vs Total Doc Converter X

FunzionalitàConvertitori onlineTotal Doc Converter X
Elaborazione batchUn file alla voltaFile illimitati per batch
Privacy dei fileFile caricati su server di terze partiI file non lasciano mai la tua macchina
Controllo della codificaSolo UTF-8, BOM forzatoUTF-8, UTF-16, ANSI, code page, BOM on/off
Contenuto multilingueIncoerente su CJK, script RTLUnicode completo preservato
AutomazioneSolo manualeRiga di comando, .bat, Utilità di pianificazione, ActiveX
Distribuzione su serverNon possibileProgettato per server, nessuna GUI necessaria
Richiede Word installatoN/DNo
Richiede internetNo

Quando serve la conversione Word in testo da riga di comando

  • Indicizzazione full-text di ricerca. Un motore di ricerca aziendale indicizza una condivisione documentale aziendale. Puntarlo su file DOCX grezzi lo costringe a portare il proprio parser; puntarlo su file TXT permette a qualsiasi indicizzatore (Elasticsearch, Solr, Sphinx, Manticore) di leggere il contenuto direttamente. Il convertitore prepara il corpus una volta, l’indicizzatore ingerisce per sempre.
  • Alimentazione di contratti a un LLM o a una pipeline ML. Tokenizer e modelli di embedding lavorano su testo semplice. Un job notturno converte i nuovi contratti in TXT e li spinge nello store di embedding, dove un modello augmentato dal recupero può rispondere a domande sul linguaggio delle clausole senza soffocare sull’XML di Word.
  • Text mining legale ed eDiscovery. Un team di supporto al contenzioso ha bisogno del corpo testuale di migliaia di prove DOC e DOCX per la ricerca per parola chiave, il clustering concettuale e la codifica predittiva. Il testo semplice è il formato di input che ogni strumento di eDiscovery comprende allo stesso modo.
  • Conservazione di email e log per la compliance. Outlook esporta i corpi delle email come DOCX. Gli archivi di compliance hanno bisogno di copie in testo semplice che qualsiasi auditor possa leggere tra vent’anni senza un’installazione di Word. Il convertitore rimuove l’involucro Word e memorizza TXT pulito accanto all’originale.
  • Estrazione di feature NLP. Sentiment scoring, riconoscimento di entità nominate e topic modelling girano su flussi di token. Convertire il DOCX di origine in TXT UTF-8 una volta significa che la pipeline NLP non rifa il parsing dello stesso documento a ogni esecuzione.
  • Archiviazione a lungo termine. I formati Word evolvono. Un DOC del 2001 ha già bisogno di uno shim di compatibilità. Il testo UTF-8 puro si aprirà ancora in qualsiasi editor nel 2050. Archiviare il corpo leggibile insieme all’originale è un’assicurazione a basso costo.

Perché Total Doc Converter X

Word non necessario

Il convertitore analizza DOC e DOCX direttamente. Non hai bisogno di Microsoft Office, LibreOffice o di qualsiasi word processor installato sul server. Questo elimina i costi di licenza e la nota instabilità dell’automazione di Word in scenari non presidiati.

Vera applicazione server

Total Doc Converter X è progettato per l’uso non presidiato. Nessuna finestra GUI, nessuna finestra di dialogo, nessun messaggio di conferma. Funziona silenziosamente dalla riga di comando o come parte di un servizio — esattamente ciò di cui ha bisogno un server di produzione.

Codifica che corrisponde alla tua pipeline

Indicizzatori di ricerca, framework NLP e archivi legacy hanno ciascuno le proprie regole di codifica. Total Doc Converter X scrive UTF-8 con o senza BOM, UTF-16 LE o BE, code page Windows ANSI 1251 e 1252 e qualsiasi altra code page registrata nel sistema. Contratti in cirillico, manuali di prodotti giapponesi, corrispondenza in arabo e documentazione tecnica tedesca sopravvivono tutti alla conversione intatti — il convertitore legge il DOC/DOCX di origine come Unicode e scrive la codifica di output scelta senza traslitterazione lossy. Imposta -Encoding una volta nel tuo file .bat e l’output corrisponde byte per byte ai consumatori a valle.

Non solo TXT

Lo stesso strumento da riga di comando converte Word in PDF, HTML, RTF, XLS, TIFF, JPEG e altro. Un’unica installazione copre tutte le tue esigenze di conversione Word. Cambia -c TXT in -c PDF e otterrai output PDF con le stesse funzionalità batch e di automazione.

Scarica la prova gratuita

(30 giorni, nessuna email o carta di credito)

Acquista licenza

(licenza server, perpetua)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022


quote

Convertitore di documenti DOC per server Recensioni dei clienti 2026

Valutalo
Valutato 4.7/5 in base alle recensioni dei clienti
5 Star

"Elaboriamo diverse migliaia di prove DOC e DOCX per pratica. Total Doc Converter X gira come batch notturno sul server di eDiscovery e produce copie testuali UTF-8 per la ricerca per parola chiave e il clustering concettuale. Il corpo testuale è pulito — nessun artefatto Word, nessun rumore di intestazione/piè di pagina, tabelle appiattite con tabulazioni. Impostare -BOM 0 è stato il piccolo dettaglio che ha reso il nostro indicizzatore felice al primo tentativo."

5 Star Caroline Whitford Litigation Support Specialist, Mid-Atlantic Law Group

"Alimentiamo corpora di contratti in una pipeline di embedding per la ricerca augmentata dal recupero. Analizzare DOCX dentro la pipeline era lento e fragile, e python-docx non era d’accordo con Word sulle celle delle tabelle. Pre-convertire in TXT puro con DOCConverter.exe ha rimosso entrambi i problemi. Il file .bat vive in Utilità di pianificazione, il job di embedding legge TXT, e abbiamo smesso di combattere con l’XML di Word."

5 Star Devansh Iyer NLP Engineer

"La compliance ci ha chiesto di tenere copie in testo puro di ogni documento clinico accanto agli originali per l’archiviazione a lungo termine. Abbiamo scelto Total Doc Converter X perché non ha bisogno di Word sul file server, e il flag di codifica ci ha permesso di standardizzare su UTF-8 senza BOM in tutto l’archivio. La documentazione potrebbe essere più dettagliata sulle regole di appiattimento delle tabelle, ma il supporto ha risposto alle nostre domande lo stesso giorno."

4 Star Margaret Holloway Records Manager, Regional Health Network

Domande frequenti ▼

Il comando base è: DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8. Questo converte ogni file Word nella cartella di origine in TXT. Usa *.doc per i file Word 97–2003 legacy, oppure *.do* per catturare sia DOC che DOCX in una sola esecuzione.
Passa -Encoding seguito dalla codifica di destinazione. I valori supportati includono UTF-8, UTF-16, UTF-16BE, ANSI e qualsiasi code page Windows registrata nel sistema (per esempio 1251 per Windows in cirillico o 1252 per l’Europa Occidentale). I byte di output corrispondono esattamente a ciò che si aspetta l’indicizzatore o il parser a valle.
Sì. Aggiungi -BOM 0 per scrivere uno stream UTF-8 pulito senza byte order mark. Usa -BOM 1 per emettere il BOM. Alcuni indicizzatori di ricerca e parser JSON rifiutano i file che iniziano con un BOM, mentre alcuni strumenti nativi Windows lo richiedono — il flag ti permette di adattarti a entrambi i lati senza post-elaborazione.
Sì. Il DOC o DOCX di origine viene letto come Unicode, quindi cirillico, greco, arabo, ebraico, cinese, giapponese, coreano e script indici raggiungono tutti l’output intatti. Scegli -Encoding UTF-8 per la copertura Unicode completa in un singolo flusso di byte, o seleziona una code page se il tuo standard d’archivio ne richiede una.
Le tabelle vengono appiattite in testo. Ogni riga diventa una linea; le celle all’interno di una riga sono separate da tabulazioni per impostazione predefinita. Questo produce un layout simile a TSV che qualsiasi foglio di calcolo, indicizzatore o lettore pandas può analizzare. La struttura a colonne della tabella originale viene preservata fintanto che il tuo strumento a valle comprende i valori separati da tabulazione.
Per impostazione predefinita le intestazioni e i piè di pagina sono inclusi una volta per documento, non ripetuti su ogni pagina, in modo che il corpo testuale resti pulito. Usa -IncludeHeaders 0 per rimuoverli del tutto, o -IncludeHeaders 1 per mantenerli. I numeri di pagina vengono rimossi perché il TXT non ha il concetto di pagine.
Sì. Total Doc Converter X si registra come oggetto COM/ActiveX (DOCConverter.DOCConverterX). Puoi richiamarlo da .NET, PHP, Python, VBScript, ASP, Ruby, Perl e qualsiasi altro ambiente compatibile COM. La tua applicazione web può accettare file DOC/DOCX caricati e restituire testo UTF-8 all’indicizzatore o all’endpoint LLM in tempo reale.

Esempi di Total Doc Converter X

Convertire file Doc con Total Doc Converter X e .NET


string src  = @"C:\test\Source.docx";
string dest = @"C:\test\Dest.pdf";

var cnv = new DocConverterX();
cnv.Convert(src, dest, "-cPDF -log c:\\test\\Doc.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

Convertire file Doc su server web con Total Doc Converter X

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\DocConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.docx";
                var outPath = Path.GetTempFileName() + ".pdf";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cPDF";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
Maggiori informazioni su Azure Functions.

Convertire file Doc su server web con Total Doc Converter X

dim C
Set C=CreateObject("DocConverter.DocConverterX")
C.Convert "c:\source.docx", "c:\dest.pdf", "-cPDF -log c:\doc.log"
Response.Write C.ErrorMessage
set C = nothing

Trasmettere il PDF risultante in streaming direttamente da ASP

dim C
Set C=CreateObject("DocConverter.DocConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.docx", "C:\www\ASP", "-cpdf -log c:\doc.log")
set C = nothing

Convertire file Doc con PHP e Total Doc Converter X

$src="C:\\test\\test.docx";
$dest="C:\\test\\test.pdf";
if (file_exists($dest)) unlink($dest);
$c= new COM("DocConverter.DocConverterX");
$c->convert($src,$dest, "-cPDF -log c:\\test\\Doc.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

Convertire file Doc con Total Doc Converter X e Ruby

require 'win32ole'
c = WIN32OLE.new('DocConverter.DocConverterX')

src = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

Convertire file Doc con Total Doc Converter X e Python

import win32com.client
import os.path

c = win32com.client.Dispatch("DocConverter.DocConverterX")

src  = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

Convertire file Doc con Pascal e Total Doc Converter X

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('DocConverter.DocConverterX');
  c.Convert('c:\test\source.docx', 'c:\test\dest.pdf', '-cPDF -log c:\test\Doc.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

Convertire file Doc su server web con Total Doc Converter X

var c = new ActiveXObject("DocConverter.DocConverterX");
c.Convert("C:\\test\\source.docx", "C:\\test\\dest.pdf", "-cPDF");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

Convertire file Doc con Total Doc Converter X e Perl

use Win32::OLE;

my $src  = "C:\\test\\test.docx";
my $dest = "C:\\test\\test.pdf";

my $c = CreateObject Win32::OLE 'DocConverter.DocConverterX';
$c->convert($src, $dest, "-cPDF -log c:\\test\\Doc.log");
print $c->ErrorMessage if -e $dest;

 

Inizia a lavorare subito!

Scarica la versione di prova e converti i tuoi file in pochi minuti.
Non è richiesta carta di credito o email.

⬇ Scarica versione di prova Windows 7/8/10/11 • 135 MB

Support
Convertitore di documenti DOC per server Preview1

Ultime Notizie

Iscriviti alla Newsletter

Non preoccuparti, non inviamo spam.


© 2026. Tutti i diritti riservati. CoolUtils File Converters

Cards