Logo
ホーム 製品 サポート コンタクト 私たちについて
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware


コマンドラインでWordをテキストに変換 — サーバー向けバッチコンバーター

DOCおよびDOCXファイルのフォルダがあり、書式ではなく可読テキスト本文が必要 — 全文インデックス作成、検索エンジンへの取り込み、NLPおよび機械学習パイプライン、eDiscoveryレビュー、長期アーカイブ用 — な場合。各ファイルをWordで開いてプレーンテキストとして保存する方法は数ファイルを超えるとスケールせず、Wordの書式アーティファクトを残します。Total Doc Converter Xは、GUIなし、Microsoft Wordのインストールも不要で、コマンドラインからWord書式を取り除きクリーンなUTF-8またはANSIテキストをバッチで書き出します。Windowsサーバーにインストールし、スクリプトやActiveX経由で呼び出して、無人で実行できます。

Total Doc Converter Xの機能

  • バッチ変換 — ワイルドカード(*.docx)を指定するだけで、一致するすべてのファイルを一回の実行で処理
  • クリーンなテキスト出力 — フォント、色、段落スタイル、ヘッダー、フッターを取り除き、可読テキスト本文のみを残す
  • エンコーディング制御 — UTF-8、UTF-16、ANSI、または任意のWindowsコードページを書き出して下流のパイプラインに合わせる
  • BOMハンドリング — UTF-8のバイト順マークを出力するか抑制し、検索インデクサーやパーサーの要件に合わせる
  • 多言語コンテンツ — ソースのDOC/DOCXに含まれるキリル、CJK、アラビア、ヘブライ、その他のUnicodeスクリプトを保持
  • Word不要 — サーバー上にMicrosoft Officeなしで、コンバーターが直接DOCとDOCXを解析
  • GUIなし — ポップアップウィンドウや確認ダイアログなしで、コマンドラインからサイレントに実行
  • ActiveX / COM — .NET、VBScript、PHP、Python、その他のCOM互換環境からコンバーターを呼び出し、独自のアプリケーションに変換機能を組み込み可能
  • .batスクリプト — コマンドをバッチファイルに保存し、Windowsタスクスケジューラでスケジュール実行して完全自動化

Wordからテキストへのコマンドライン変換

無料体験版をダウンロード

(30日間、メール登録不要)

ライセンスを購入

(サーバーライセンス、永続版)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022

Word vs テキスト: なぜ変換が必要か?

DOCとDOCXは人間の読書と編集向けに構築されたMicrosoft Word形式です。DOCXファイルはXMLパーツ、埋め込みメディア、スタイル、改訂履歴、コメント、変更履歴を含むZIPコンテナです。検索エンジン、インデクサー、LLMトークナイザー、eDiscoveryパイプラインはこれらに関心がありません — 関心があるのは可読テキストです。これらのシステムを生のWordファイルに向けると、すべてのコンシューマーが独自のDOC/DOCXパーサーを持たなければならず、エッジケースで意見が分かれます。

TXTは最小公倍数です。すべての検索インデクサー、すべてのNLPツールキット、すべてのgrepスタイルツール、すべてのdiffユーティリティはプレーンテキストを同じように読み取ります。Wordをサーバーで一度TXTに変換すれば、すべての下流コンシューマーが同じクリーンな入力を得ます。テーブルはタブ区切りの行または改行にフラット化されます。画像は除外されます。ヘッダーとフッターはフラグに応じて保持または削除できます。残るのは本文コンテンツであり、インデックス作成や特徴抽出に使えます。

DOC / DOCXTXT
コンテンツテキスト + 書式 + メディアテキストのみ
ファイルサイズ数十〜数百KB通常、元のサイズの5〜20%
インデックス作成DOC/DOCXパーサーが必要あらゆるインデクサーやトークナイザーで動作
テーブル構造化セルタブ区切り行にフラット化
画像埋め込み削除
対象者レビュアー、エディター検索、NLP、アーカイブ、eDiscovery

コマンドラインでWordをテキストに変換する方法

ステップ1. Total Doc Converter Xをインストール

上のリンクからインストーラーをダウンロードし、Windowsサーバーまたはワークステーションで実行します。セットアップは1分以内で完了します。Microsoft Word、LibreOffice、ブラウザのインストールは不要です — コンバーターは独自エンジンでDOCとDOCXを直接解析し、指定したエンコーディングでプレーンテキストを書き出します。

ステップ2. コマンドプロンプトを開く

cmd.exeまたはPowerShellを開きます。コンバーターの実行ファイルはDOCConverter.exeで、インストールフォルダ(通常はC:\Program Files\CoolUtils\TotalDocConverterX\)にあります。システムPATHに追加するか、コマンドでフルパスを使用してください。

ステップ3. 基本変換を実行

最もシンプルなコマンドは、フォルダ内のすべてのDOCXファイルをTXTに変換します:

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8

このコマンドはC:\Docs\内のすべての.docxファイルを処理し、変換後のTXTファイルをC:\Output\に保存します。各Wordファイルから同じベース名のTXTが1つ生成されます。レガシーのWord 97〜2003ドキュメントには*.docを、両方を同時にキャッチするには*.do*を使用してください。

ステップ4. エンコーディングとロギングオプションを追加

追加のフラグでTXT出力を制御します:

DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log
  • -Encoding UTF-8 — 出力エンコーディング(UTF-8、UTF-16、ANSI、1251、1252など)
  • -BOM 0 — UTF-8のバイト順マークを抑制。-BOM 1で書き出し
  • -LineBreaks CRLF — Windows形式の\r\nまたはLFでUnix形式の\n
  • -log C:\Logs\word2txt.log — 検証用の変換ログを出力

ステップ5. .batファイルで自動化

コマンドを.batファイルに保存し、Windowsタスクスケジューラでスケジュールします:

@echo off
"C:\Program Files\CoolUtils\TotalDocConverterX\DOCConverter.exe" C:\Incoming\*.docx C:\Archive\TXT\ -c TXT -Encoding UTF-8 -BOM 0 -log C:\Logs\word2txt.log

これにより、毎晩(または設定した任意の間隔で)変換が実行され、結果を検証できるログファイルが出力されます。出力フォルダを検索インデクサーまたはNLP取り込みジョブとペアリングすれば、パイプラインは手動ステップなしで端から端まで実行されます。

ActiveX / COM統合

Total Doc Converter Xには完全なActiveXインターフェースが含まれています。.NET、VBScript、PHP、Python、Ruby、ASPなど、あらゆるCOM互換環境からコンバーターを呼び出せます。これにより、コマンドラインプロセスを外部起動することなく、独自のウェブアプリケーション、eDiscoveryプラットフォーム、ドキュメントワークフローにWord-to-Text変換を組み込めます。

例(C#/.NET):

DOCConverterX Cnv = new DOCConverterX();
Cnv.Convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

例(PHP):

$c = new COM("DOCConverter.DOCConverterX");
$c->convert("C:\\Docs\\contract.docx", "C:\\Output\\contract.txt", "-c TXT -Encoding UTF-8 -BOM 0 -log c:\\Logs\\doc.log");

同じ呼び出しがASP.NET、VBScript、Python、Ruby、Perl、JavaScript(Windows Script Host)でも動作します。ウェブアプリケーションでアップロードされたWordファイルを受け取り、リアルタイムでクリーンなUTF-8テキストをインデクサー、LLMエンドポイント、ストレージ層に返すことができます。

オンラインコンバーター vs Total Doc Converter X

機能オンラインコンバーターTotal Doc Converter X
バッチ処理一度に1ファイルのみバッチあたりファイル数無制限
ファイルのプライバシーサードパーティサーバーにアップロードファイルは自分のマシンから外に出ない
エンコーディング制御UTF-8のみ、BOM強制UTF-8、UTF-16、ANSI、コードページ、BOMオン/オフ
多言語コンテンツCJK、RTLスクリプトで不安定完全Unicode保持
自動化手動のみコマンドライン、.bat、タスクスケジューラ、ActiveX
サーバー展開不可サーバー向け設計、GUI不要
Wordのインストール必須該当なし不要
インターネット必要はいいいえ

Wordからテキストへのコマンドライン変換が必要な場面

  • 全文検索インデックス作成。エンタープライズ検索エンジンが企業のドキュメント共有をインデックス化します。生のDOCXファイルに向けると、独自のパーサーを持つ必要があります。TXTファイルに向ければ、あらゆるインデクサー(Elasticsearch、Solr、Sphinx、Manticore)がコンテンツを直接読み取れます。コンバーターはコーパスを一度準備し、インデクサーは永遠に取り込みます。
  • 契約をLLMやMLパイプラインに供給。トークナイザーと埋め込みモデルはプレーンテキストで動作します。夜間ジョブが新しい契約をTXTに変換し、埋め込みストアにプッシュすれば、検索拡張モデルがWord XMLで詰まることなく条項について質問に答えられます。
  • 法的テキストマイニングとeDiscovery。訴訟支援チームは、キーワード検索、概念クラスタリング、予測コーディングのために数千のDOCとDOCX証拠の本文を必要とします。プレーンテキストは、すべてのeDiscoveryツールが同じように理解する入力形式です。
  • コンプライアンスのためのメールとログ保存。OutlookはメールボディをDOCXとしてエクスポートします。コンプライアンスアーカイブは、20年後にWordをインストールせずに監査人が読めるプレーンテキストコピーを必要とします。コンバーターはWordラッパーを取り除き、元のものとともにクリーンなTXTを保存します。
  • NLP特徴抽出。感情スコアリング、固有表現認識、トピックモデリングはトークンストリームで動作します。ソースDOCXをUTF-8 TXTに一度変換すれば、NLPパイプラインは実行ごとに同じドキュメントを再解析せずに済みます。
  • 長期アーカイブ。Word形式は進化します。2001年のDOCはすでに互換性シムを必要とします。プレーンUTF-8テキストは2050年でもどのエディタでも開けます。元のものとともに可読本文をアーカイブするのは安価な保険です。

Total Doc Converter Xを選ぶ理由

Word不要

コンバーターはDOCとDOCXを直接解析します。サーバーにMicrosoft Office、LibreOffice、その他のワードプロセッサをインストールする必要はありません。これによりライセンスコストを回避し、無人シナリオでのWord自動化のよく知られた不安定さを回避できます。

真のサーバーアプリケーション

Total Doc Converter Xは無人運用向けに設計されています。GUIウィンドウ、ダイアログボックス、確認プロンプトはありません。コマンドラインから、またはサービスの一部としてサイレントに実行されます — 本番サーバーに必要なものそのものです。

パイプラインに合うエンコーディング

検索インデクサー、NLPフレームワーク、レガシーアーカイブにはそれぞれ独自のエンコーディングルールがあります。Total Doc Converter XはBOMありまたはなしのUTF-8、UTF-16 LEまたはBE、Windows ANSIコードページ1251および1252、その他システムに登録されているコードページを書き出します。キリル契約、日本語の製品マニュアル、アラビア通信、ドイツ語の技術文書はすべて変換をそのまま生き残ります — コンバーターはソースDOC/DOCXをUnicodeとして読み取り、選択した出力エンコーディングを不可逆なトランスリテレーションなしで書き出します。.batファイルで-Encodingを一度設定すれば、出力は下流コンシューマーにバイト単位で一致します。

TXTだけではない

同じコマンドラインツールでWordをPDF、HTML、RTF、XLS、TIFF、JPEGなどに変換できます。1回のインストールですべてのWord変換ニーズに対応します。-c TXT-c PDFに変更するだけで、同じバッチ機能と自動化機能でPDF出力が得られます。

無料体験版をダウンロード

(30日間、メールやクレジットカード不要)

ライセンスを購入

(サーバーライセンス、永続版)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022


quote

トータルドックコンバーターX 顧客レビュー 2026

評価
顧客レビューに基づく評価:4.7/5
5 Star

"案件ごとに数千のDOCおよびDOCX証拠を処理しています。Total Doc Converter XはeDiscoveryサーバー上で夜間バッチとして実行され、キーワード検索と概念クラスタリング用のUTF-8テキストコピーを生成します。テキスト本文はクリーンで — Wordアーティファクトなし、ヘッダー/フッターのノイズなし、テーブルはタブにフラット化されます。-BOM 0を設定したことが、当社のインデクサーが初回試行で動作した小さな決め手でした。"

5 Star Caroline Whitford Litigation Support Specialist, Mid-Atlantic Law Group

"検索拡張のために契約コーパスを埋め込みパイプラインに供給しています。パイプライン内でDOCXを解析するのは遅く脆弱で、python-docxはテーブルセルでWordと意見が分かれていました。DOCConverter.exeでプレーンTXTに事前変換することで両方の問題を解消しました。.batファイルはタスクスケジューラに常駐し、埋め込みジョブはTXTを読み取り、Word XMLとの戦いをやめました。"

5 Star Devansh Iyer NLP Engineer

"コンプライアンスから、長期アーカイブのために臨床ドキュメントごとにオリジナルとともにプレーンテキストコピーを保持するよう求められました。Total Doc Converter Xを選んだのは、ファイルサーバーにWordが不要だからです。エンコーディングフラグでアーカイブ全体でBOMなしUTF-8に標準化できました。テーブルフラット化のルールに関するドキュメントはもう少し詳細にしてほしいですが、サポートは当日に質問に答えてくれました。"

4 Star Margaret Holloway Records Manager, Regional Health Network

FAQ ▼

基本コマンドは DOCConverter.exe C:\Docs\*.docx C:\Output\ -c TXT -Encoding UTF-8 です。ソースフォルダ内のすべてのWordファイルをTXTに変換します。レガシーのWord 97〜2003ファイルには*.doc、DOCとDOCXの両方を1回でキャッチするには*.do*を使用してください。
-Encodingに続けてターゲットエンコーディングを渡します。サポートされる値にはUTF-8UTF-16UTF-16BEANSI、システムに登録されているWindowsコードページ(例えばキリルWindowsの1251、西ヨーロッパの1252)が含まれます。出力バイトは下流のインデクサーやパーサーが期待するものに正確に一致します。
はい。-BOM 0を追加して、バイト順マークなしのクリーンなUTF-8ストリームを書き出します。-BOM 1でBOMを出力します。一部の検索インデクサーやJSONパーサーはBOMで始まるファイルを拒否しますが、一部のWindowsネイティブツールはBOMを必要とします — このフラグで後処理なしにどちらにも対応できます。
はい。ソースのDOCまたはDOCXはUnicodeとして読み取られるため、キリル、ギリシャ、アラビア、ヘブライ、中国語、日本語、韓国語、インド系スクリプトはすべて出力にそのまま到達します。単一のバイトストリームで完全なUnicodeカバレッジを得るには-Encoding UTF-8を選択するか、アーカイブ標準が要求するならコードページを選んでください。
テーブルはテキストにフラット化されます。各行が1行になり、行内のセルはデフォルトでタブで区切られます。これによりTSVのようなレイアウトが生成され、あらゆるスプレッドシート、インデクサー、pandasリーダーが解析できます。下流ツールがタブ区切り値を理解する限り、元のテーブルの列構造は保持されます。
デフォルトでは、ヘッダーとフッターは各ページに繰り返し出力されるのではなく、ドキュメントごとに1回含まれるため、テキスト本文はクリーンに保たれます。完全に削除するには-IncludeHeaders 0、保持するには-IncludeHeaders 1を使用してください。TXTにはページの概念がないため、ページ番号は削除されます。
はい。Total Doc Converter XはCOM/ActiveXオブジェクト(DOCConverter.DOCConverterX)として登録されます。.NET、PHP、Python、VBScript、ASP、Ruby、Perl、その他のCOM互換環境から呼び出せます。ウェブアプリケーションはアップロードされたDOC/DOCXファイルを受け取り、リアルタイムでインデクサーやLLMエンドポイントにUTF-8テキストを返すことができます。

Total Doc Converter X の使用例

Total Doc Converter X と .NET で Doc ファイルを変換する


string src  = @"C:\test\Source.docx";
string dest = @"C:\test\Dest.pdf";

var cnv = new DocConverterX();
cnv.Convert(src, dest, "-cPDF -log c:\\test\\Doc.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

Total Doc Converter X で Web サーバー上の Doc ファイルを変換する

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\DocConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.docx";
                var outPath = Path.GetTempFileName() + ".pdf";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cPDF";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
Azure Functions の詳細情報。

Total Doc Converter X で Web サーバー上の Doc ファイルを変換する

dim C
Set C=CreateObject("DocConverter.DocConverterX")
C.Convert "c:\source.docx", "c:\dest.pdf", "-cPDF -log c:\doc.log"
Response.Write C.ErrorMessage
set C = nothing

ASP から生成された PDF を直接ストリーミングする

dim C
Set C=CreateObject("DocConverter.DocConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.docx", "C:\www\ASP", "-cpdf -log c:\doc.log")
set C = nothing

PHP と Total Doc Converter X で Doc ファイルを変換する

$src="C:\\test\\test.docx";
$dest="C:\\test\\test.pdf";
if (file_exists($dest)) unlink($dest);
$c= new COM("DocConverter.DocConverterX");
$c->convert($src,$dest, "-cPDF -log c:\\test\\Doc.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

Total Doc Converter X と Ruby で Doc ファイルを変換する

require 'win32ole'
c = WIN32OLE.new('DocConverter.DocConverterX')

src = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

Total Doc Converter X と Python で Doc ファイルを変換する

import win32com.client
import os.path

c = win32com.client.Dispatch("DocConverter.DocConverterX")

src  = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

Pascal と Total Doc Converter X で Doc ファイルを変換する

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('DocConverter.DocConverterX');
  c.Convert('c:\test\source.docx', 'c:\test\dest.pdf', '-cPDF -log c:\test\Doc.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

Total Doc Converter X で Web サーバー上の Doc ファイルを変換する

var c = new ActiveXObject("DocConverter.DocConverterX");
c.Convert("C:\\test\\source.docx", "C:\\test\\dest.pdf", "-cPDF");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

Total Doc Converter X と Perl で Doc ファイルを変換する

use Win32::OLE;

my $src  = "C:\\test\\test.docx";
my $dest = "C:\\test\\test.pdf";

my $c = CreateObject Win32::OLE 'DocConverter.DocConverterX';
$c->convert($src, $dest, "-cPDF -log c:\\test\\Doc.log");
print $c->ErrorMessage if -e $dest;

今すぐ作業を開始!

無料トライアルをダウンロードして、ファイルを数分で変換。
クレジットカードもメールアドレスも不要。

⬇ 無料トライアルをダウンロード Windows 7/8/10/11 • 135 MB

Support
トータルドックコンバーターX Preview1

最新ニュース

ニュースレター購読

安心してください、スパムは送りません。


© 2026. 全著作権所有. CoolUtils File Converters

Cards