WordドキュメントをWebサイトに公開したり、CMSに取り込んだり、XSLTパイプラインで処理する必要があるのに、DOCおよびDOCXファイルはそのままではWeb対応していません。WordでHTMLとして保存すると、XMLベースのワークフローで問題を起こすことが多い、ばらつきのある不正確なマークアップが生成されます。Total Doc ConverterはWordファイルを有効なXHTMLに変換します。ブラウザで正しく表示され、あらゆるXMLツールで正しくパースできる、厳密なXML準拠の出力です。
(30日間無料試用版付き)
(わずか $49.90)
DOCはMicrosoftが1983年に導入した独自のバイナリ形式です。DOCXは2007年にZIP圧縮されたXMLパッケージとしてDOCの後継となりました。どちらもフォント、テーブル、画像、ヘッダー、脚注、マクロなどのリッチな書式を持ちます。完全なレンダリングにはMicrosoft Wordまたは互換エディターが必要です。これらの形式はデスクトップでの編集や印刷向けに設計されており、Web表示や自動処理向けではありません。
XHTMLは厳密なXMLとして再定式化されたHTMLです。すべての要素に閉じタグが必要で、属性値は引用符で囲まれ、タグ名は小文字でなければならず、ドキュメントはDTDに従わなければなりません。XHTMLファイルは通常のHTMLと同様にどのブラウザでも表示できますが、XMLプロセッサー、XSLTエンジン、自動パイプラインでもパースできます。この二重の性質により、Webコンテンツが人間にも閲覧でき機械でも処理できる必要がある場合、XHTMLが定番フォーマットとなっています。
WordをXHTMLに変換すると、ドキュメントのテキスト、テーブル、書式が有効なXMLマークアップになります。結果はブラウザで開け、W3C検証に合格します。Word の「HTMLとして保存」出力とは異なり — それは独自タグや閉じタグの欠落で溢れています — Total Doc ConverterのXHTMLはクリーンで標準準拠、さらなる処理にすぐ使えます。
各Wordファイルは個別のXHTMLドキュメントになります。元のファイルは変更されません。何百ものドキュメントでも、一括処理は数秒で完了します。
Total Doc Converterには無人処理用のコマンドラインインターフェースが含まれています。単一ファイルの変換:
DocConverter.exe C:\Docs\report.docx C:\Output\report.xhtml -c XHTML
ワイルドカードを使ってフォルダー全体を変換:
DocConverter.exe C:\Docs\*.doc C:\Output\ -c XHTML
このコマンドを.batファイルに保存し、Windowsタスクスケジューラーでスケジュール設定します。ソースフォルダーに追加された新しいWordファイルは、毎日または毎週自動的にXHTMLに変換されます — 手動作業は不要です。

有効なXHTML出力。コンバーターはW3C検証に合格する整形式のXMLを生成します。すべてのタグが正しく閉じられ、属性は引用符で囲まれ、ドキュメントには正しいDOCTYPEとXML宣言が含まれます。出力はブラウザとXMLプロセッサーの両方で機能します。
バッチ処理。10個でも10,000個でもWordファイルが入ったフォルダーを選択して、一度にすべてをXHTMLに変換します。Wordで各ファイルを開いて手動で再保存する必要はありません。
クリーンなマークアップ。Wordの組み込み「HTMLとして保存」はMicrosoft Officeの独自タグ、条件付きコメント、インラインスタイルを埋め込み、ファイルサイズを膨らませます。Total Doc Converterはこれらの不要な要素を取り除き、コンパクトで標準準拠のXHTMLを生成します。
書式の正確な再現。フォント、テーブル、画像、ヘッダー、フッター、段落スタイルが変換後も保持されます。XHTMLの出力はWordオリジナルの構造と一致します。
クラウドアップロードなし。すべての処理はPC上でローカルに行われます。契約書、法的文書、社内レポートは一切外部に出ません。
20以上の出力フォーマット。XHTML以外にも、同じツールでWordをPDF、HTML、TXT、RTF、XLS、JPEG、TIFFなどに変換できます。
| 機能 | オンラインツール | Total Doc Converter |
|---|---|---|
| ファイルサイズ制限 | 10–50 MB | 制限なし |
| 一括変換 | 一度に1〜5ファイル | 無制限 |
| プライバシー | ファイルをクラウドにアップロード | 100%オフライン |
| XML有効性 | 不正確で壊れたHTMLが多い | 厳密なXHTML / W3C準拠 |
| 速度 | 接続状況に依存 | 即時(ローカルCPU) |
| 自動化 | なし、または有料API | 組み込みコマンドライン |
| 書式品質 | 基本的 — 複雑なテーブルは壊れることが多い | 完全保持 |
| 価格 | サブスクリプションまたはファイルごとの料金 | 買い切り $49.90 |
(30日間無料試用版付き)
(わずか $49.90)
"私たちのCMSはインポートコンテンツに有効なXHTMLのみを受け付けます。以前はWordからHTMLをエクスポートして、閉じていないタグや引用符のない属性を修正するのに1時間かけていました。Total Doc Converterを使えば、出力は最初から有効なXHTMLです。バッチモードは本当に助かります — 毎週30〜40本のWordの原稿を、1つのファイルにも手を触れることなく変換しています。"
Elena Kowalski Web Content Manager, Publishing House
"私たちは製品ドキュメントを複数の出力フォーマットに変換するXSLTパイプラインを運用しています。パイプラインには整形式のXML入力が必要です。コマンドラインコンバーターを使ったスケジュールタスクを設定して、毎晩届くDOCXファイルをXHTMLに変換しています。6ヶ月間、検証エラーは一度も発生していません。"
Thomas Brennan Integration Developer
"患者情報ドキュメントを長期保存のためにXHTMLでアーカイブしています。このフォーマットはブラウザでも閲覧でき、機械でもパースできるため、監査担当者の要件を満たしています。Total Doc Converterは一括変換を確実に処理し、すべてのファイルをローカルサーバーに保存します — クラウドアップロードがないことが私たちにとって非常に重要です。"
Sarah Lindgren Compliance Officer, Healthcare Organization
DocConverter.exe C:\Docs\*.docx C:\Output\ -c XHTML。.batファイルに保存して、自動処理のためにWindowsタスクスケジューラーでスケジュール設定できます。無料トライアルをダウンロードして、ファイルを数分で変換。
クレジットカードもメールアドレスも不要。