Logo
首页 产品 支持 联系 关于我们
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware

DOC 文件批量转换工具(服务器端)

在Web服务器上将Doc转换为PDF, HTML, XLS, 图像和文本。

带有ActiveX的服务器Doc转换器

Windows
2000/2003/Vista
7/8/10/11
and
2012/2016/2019/2022 Server
and
Docker/Citrix/Wine

Total Doc Converter X 是一款服务器端 SDK,可将 Word 文档(DOC、DOCX、DOCM、RTF、TXT)转换为 PDF、HTML、XHTML、XLS、JPG、TIFF、PNG、RTF 和 Unicode TXT—无需在服务器上安装 Microsoft Word、Office Interop 或任何无界面 Office 实例。它以静默方式运行:无图形界面、无对话框、无弹窗。Total Doc Converter X 同时提供命令行程序和 ActiveX/COM 接口,可直接接入 ASP、PHP、.NET、Python、Ruby、Java 以及任何支持 COM 的后端。源格式覆盖范围:

  • Microsoft Word 文档:DOC(Word 97–2003)、DOCX(OOXML)、DOCM(启用宏)
  • 富文本格式(RTF)
  • 纯文本(TXT,ANSI 和 UTF-8)
  • 带显式编码的 Unicode 文本
Total Doc Converter X 覆盖完整的服务器端转换场景:PDF 输出支持数字签名(X.509 PFX 证书)、AES-256 加密以及逐项权限标志;HTML 输出包含嵌入图片和 CSS;XLS 提取表格便于电子表格摄取;JPG/TIFF 栅格化用于归档或缩略图;通过文件夹掩码和递归(-Recurse -kfs)实现整棵文档树的批量处理;与 Total Folder Monitor 联动,实现文件到达即触发的热文件夹自动转换。

多用户友好:在 Windows 服务器上一次安装,即可作为 Web 服务对外暴露,或作为 Windows 服务运行。多线程引擎以最高速度处理批量任务。兼容 IIS、Docker、Citrix 和 Wine。

免费试用(30 天试用期,无任何限制),亲自验证它是否物有所值。

当前支持的部分文件格式转换:

    DOC / DOCX
  • DOC 转 PDF(数字签名)
  • DOCX 转 PDF(加密)
  • DOC 转 HTML(含嵌入图片)
  • DOC 转 RTF / TXT
    转为数据 / 电子表格
  • DOC 表格转 XLS
  • DOC 转 Unicode TXT
  • DOCX 转 XHTML
  • RTF 转 PDF
    转为图片
  • DOC 转 JPG
  • DOCX 转 TIFF(多页)
  • DOC 转 PNG

面向 AI / RAG 流水线的输出 — Markdown + Docling 旁路文件

LLM 智能体(Claude、ChatGPT、Cursor、Cline)和检索框架(LangChain、LlamaIndex、Haystack)并不读取 DOCX — 它们读取的是文本。Total Doc Converter X 会把 Word 文档写成 GitHub-Flavored Markdown,配以结构化的 frontmatter 与可选的 Docling 兼容旁路文件,让文档进入您的向量存储时保留其标题、列表、表格以及内嵌图片引用 — 而不是变成一段丢失了章节结构的扁平文字。

选择 Markdown 输出后您会得到:

  • Word 样式映射到 Markdown 结构Heading 1Heading 6 变成 # / ## / ###;项目符号与编号列表保留为列表;Quote 样式映射为 > 引用块
  • 表格保留为 GFM 表格 — 合并单元格、多行表头与单元格对齐方式均会被保留
  • 内嵌图片随旁保存 — 以 ![](image-001.png) 形式引用,存在时一并保留原始题注
  • YAML frontmattersource_fileformat(MIME)、来自文档元数据的 titleauthorcreatedmodified、检测到的 languagesgenerator,以及用于溯源的 binary_hash
  • 可选的 .docling.json 旁路文件 — 符合 Docling schema 的 JSON:表格边界矩形、列表嵌套层级、样式锚点,以及分块器可读取的 chunks_hint 数组
  • LangChain / LlamaIndex / Haystack / Claude MCP 开箱即用 — 无需胶水代码,也无需维护 python-docx 包装层

这就是 CoolUtils RAG Adapter — 一套统一的 Markdown 约定,由每款 Total Converter X 产品共享。完整规范、样例 .md + .docling.json 以及集成代码片段,请见 Coolutils Converter X — RAG Adapter 页面。

立即下载!

(包括30天免费试用)

购买许可证

(仅 $750.00)



Total Doc Converter X 示例

使用 Total Doc Converter X 和 .NET 转换 Doc 文件


string src  = @"C:\test\Source.docx";
string dest = @"C:\test\Dest.pdf";

var cnv = new DocConverterX();
cnv.Convert(src, dest, "-cPDF -log c:\\test\\Doc.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

使用 Total Doc Converter X 在 Web 服务器上转换 Doc 文件

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\DocConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.docx";
                var outPath = Path.GetTempFileName() + ".pdf";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cPDF";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
关于 Azure Functions 的更多信息。

使用 Total Doc Converter X 在 Web 服务器上转换 Doc 文件

dim C
Set C=CreateObject("DocConverter.DocConverterX")
C.Convert "c:\source.docx", "c:\dest.pdf", "-cPDF -log c:\doc.log"
Response.Write C.ErrorMessage
set C = nothing

从 ASP 直接流式输出生成的 PDF

dim C
Set C=CreateObject("DocConverter.DocConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.docx", "C:\www\ASP", "-cpdf -log c:\doc.log")
set C = nothing

使用 PHP 和 Total Doc Converter X 转换 Doc 文件

$src="C:\\test\\test.docx";
$dest="C:\\test\\test.pdf";
if (file_exists($dest)) unlink($dest);
$c= new COM("DocConverter.DocConverterX");
$c->convert($src,$dest, "-cPDF -log c:\\test\\Doc.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

使用 Total Doc Converter X 和 Ruby 转换 Doc 文件

require 'win32ole'
c = WIN32OLE.new('DocConverter.DocConverterX')

src = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

使用 Total Doc Converter X 和 Python 转换 Doc 文件

import win32com.client
import os.path

c = win32com.client.Dispatch("DocConverter.DocConverterX")

src  = "C:\\test\\test.docx"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\Doc.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

使用 Pascal 和 Total Doc Converter X 转换 Doc 文件

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('DocConverter.DocConverterX');
  c.Convert('c:\test\source.docx', 'c:\test\dest.pdf', '-cPDF -log c:\test\Doc.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

使用 Total Doc Converter X 在 Web 服务器上转换 Doc 文件

var c = new ActiveXObject("DocConverter.DocConverterX");
c.Convert("C:\\test\\source.docx", "C:\\test\\dest.pdf", "-cPDF");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

使用 Total Doc Converter X 和 Perl 转换 Doc 文件

use Win32::OLE;

my $src  = "C:\\test\\test.docx";
my $dest = "C:\\test\\test.pdf";

my $c = CreateObject Win32::OLE 'DocConverter.DocConverterX';
$c->convert($src, $dest, "-cPDF -log c:\\test\\Doc.log");
print $c->ErrorMessage if -e $dest;

quote

DOC 文件批量转换工具(服务器端) 客户评价 2026

评价
基于客户评价评分4.7/5
5 Star

"到目前为止,Total Doc Converter X 一直在正确完成工作,即在 Windows 计划任务中通过命令行将 Doc 文件转换为 PDF 文件。如果遇到任何问题,我一定会联系你们。感谢这款产品。"

5 Star Brandon Belma
NSG Consulting

"我们使用 Total Doc Converter 已有数年,最近刚刚升级到 X 版本。它一直运行得很好,我们对这款产品非常满意。我们用它把文档转换为 PDF 格式。我打算仔细看看文档,看还能用它做些什么。"

4 Star Todd Braley
IT Manager, DRI Title And Escrow

"客户提交的诉状和动议是带有内嵌批注和修订记录的 DOCX 文件。Total Doc Converter X 配合 -PFXFile/-PFXPass 生成的签名归档 PDF 能被法院系统接受。我们替换掉了原先的 Word Interop 流程—过去只要客户发来一个损坏的 DOC,那条流水线就会崩溃;这里内置的解析器更宽容,而 Word 在那种情况下根本拒绝打开文件。已在生产环境运行五年,没有一次故障可以归咎于这款转换器。"

5 Star Marek L.
Senior Backend Developer at a legal-tech vendor

"员工政策文档由客户以数十种企业模板的 DOCX 形式发送过来。我们在文档进入员工门户之前,将每一份都渲染为带水印戳记和 Bates 页码的 PDF。Total Doc Converter X 加上 Total Folder Monitor:客户把文件丢进收件文件夹,转换器把它们处理掉,门户再取走 PDF。我们任何一台转换虚拟机上都没有装 Word,没有授权方面的疑虑,按我们目前的硬件吞吐量大约是每分钟 200 份文档。"

5 Star Yuna K.
DevOps Engineer at an HR SaaS

"我们以 Royalty-Free 许可证将 Total Doc Converter X 集成到自家的文档管理产品中。一次性的项目费用只是 Aspose.Words 按开发人员订阅价格的零头。我们的安装程序会发布并注册 ActiveX,应用程序直接调用它,最终用户只看到我们自己的界面。32 位 ActiveX 的限制让我们花了几天时间重做流水线,但当我们询问变通方案时,技术支持响应得很及时。"

4 Star Karim Z.
Independent Software Vendor


谁在使用 Total Doc ConverterX?

在服务器上将 Word 文档转换为 PDF、图像及其他格式的开发人员和 IT 团队

Web Applications

在线文档转换

通过 ActiveX 为您的 Web 应用添加 DOC 转 PDF 功能

Web 开发人员将 Total Doc ConverterX 集成到 ASP、PHP 或 .NET 应用程序中,让用户可以上传 Word 文件并获得转换后的 PDF、HTML 或图像输出。转换器在服务器上静默运行,无图形界面,可同时处理多个转换请求而不中断。

Document Management

DMS 与 ECM 集成

将 Word 上传文件转换为 PDF 和 TIFF 用于归档系统

文档管理平台使用 Total Doc ConverterX 将传入的 DOC 和 DOCX 文件转换为标准化存储用的 PDF 或基于图像归档用的 TIFF。转换器精确保留文档版式,并在批量处理整个目录树时保持文件夹结构。

Enterprise Automation

自动化文档流水线

通过命令行在服务器上转换 Word 文件

企业 IT 团队通过计划批处理任务运行 Total Doc ConverterX,转换来自电子邮件系统、上传门户和共享驱动器的 Word 文件。配合 Total Folder Monitor 使用,可在监控文件夹中自动转换新到达的 DOC 文件——完全无需人工干预,无弹出窗口。

Multi-User Networks

网络转换服务

为网络上的所有用户提供文档转换服务

组织在中央服务器上部署 Total Doc ConverterX,让各部门员工通过共享服务将 Word 文档转换为 PDF、XLS、HTML 或图像。单台服务器安装替代数十套桌面转换器——降低许可成本和 IT 维护负担。

Software Development

用于自定义应用的文档 SDK

将 Word 转换功能嵌入您自己的软件产品

软件厂商通过 ActiveX 将 Total Doc ConverterX 集成到其应用程序中,无需自行构建渲染引擎即可提供 DOC 转 PDF、DOC 转 TIFF 和 DOC 转 HTML 转换功能。该 API 处理 Word、DOCX、RTF 和 TXT 文件,完整保留版式,并提供可自定义的输出设置。

Total Doc Converter X 的独特选项


doc to pdf
Total Doc Converter X 将 Doc 转换为 PDF,并允许您使用数字签名签署最终文档。

combine doc
转换并合并多个文档为一个多页文件(PDF、DOC、TIFF 或非常长的 TXT 文件)。全部一气呵成!

time stamps
如果您希望保留,Total Doc Converter X 可以复制原始时间戳。

docx
有一个过时的 Microsoft Office 2003 吗?一次性更新所有旧文件到新格式。使用 Total Doc Converter X 将 Doc 文件转换为 DocX。

font
针对每个目标格式调整纸张格式:使转换后的副本适合在特定纸张上打印。

print doc
Total Doc Converter X 可以打印,传真发送到 OneNote 您选择的任何文件。它还会创建详细的 PDF、XLS、CSV、TXT 格式的 Doc 文件报告。这是了解您有多少文件及其参数的最简单方法。


interface
我们提供很多 PHP、C#、ASP 的示例,以便你不会在代码行中迷失。

doc formats
支持文件类型最广泛的列表:批量模式下将 Word、Doc、DocX、DocM、RTF、RVF 或 TXT 文件转换为 RTF、DOCX、XLS、JPEG、PNG、TIFF、HTML、XHTML、PDF、TXT。同样价格下还有比这更强大的 doc 转换器吗?

doc converter
Total Doc Converter X 支持多种 TIFF 压缩类型。如果您感到困惑,程序将自动选择最佳值。

preview doc
Total Doc Converter X 附带 ActiveX。您可以将文档转换器添加到自己的应用程序中(申请开发者许可)。

header
在输出文件的页眉或页脚中添加您的标志或任何其他图像。

page
想要更有序?Total Doc Converter X 将为输出文件的每一页添加页码或日期。该应用程序还适用于法律文献的缩印!

time stamps
在执行图形格式转换时压缩转换副本的能力:获得最佳尺寸/质量比例。

doc to pdf
Total Doc Converter X 为 Doc 到 PDF 的转换提供许多附加设置。设置用户权限、密码保护您的文件或使用数字签名进行签名。获得 PDF、PDF/A 和不可搜索的 PDF。


command line
Total Doc Converter X 没有 GUI,通过命令行运行。

命令行示例

Total Doc ConverterX 附带 DocConverterX.exe,这是一个可以从脚本、计划任务、CI 运行器或任何后端服务驱动的控制台二进制程序。标志集与 GUI 版的 DocConverter.exe 一致;完整参考请参阅命令行文档。下面的配方涵盖了我们最常从 SDK 客户那里听到的场景。

1. 将单个 Word 文档转换为 PDF

最简单的调用方式 —— 一个源文件、一个输出、一个目标格式。

DocConverterX.exe "C:\contracts\NDA.doc" "C:\out\NDA.pdf" -cPDF

2. 按掩码批处理 DOC 文件夹

处理文件夹中的每个 DOC,并将 PDF 放入同级输出目录。

DocConverterX.exe "C:\contracts\*.doc" "C:\out\" -cPDF

将掩码替换为 *.rtf*.txt 以转换其他源格式。

3. 将 DOCX 转换为 PDF

同一个二进制程序处理现代 Word 文档。将掩码指向 *.docx,转换器无需任何额外标志即可识别新格式。

DocConverterX.exe "C:\contracts\*.docx" "C:\out\" -cPDF

4. 递归项目树并镜像其文件夹结构

法律和人力资源档案很少存在于一个平面文件夹中。-Recurse 遍历子目录;-kfs 在输出端重新创建相同的树,而不是将每个文件展平到一个桶中。

DocConverterX.exe "C:\contracts\2026\*.doc" "C:\out\2026\" -cPDF -Recurse -kfs

5. 从列表文件驱动队列

当上游工作进程写入队列文件而转换器消耗它时,您不希望将每个文件路径编码到命令行本身。-list 从文本文件中读取文件掩码(每行一个)。

DocConverterX.exe -list "C:\queues\contracts.txt" "C:\out\" -cPDF

6. 高 DPI 归档 TIFF(Group 4 传真压缩)

长期文档档案通常是带 G4 压缩的黑白 TIFF —— 占磁盘空间小,无损,每个图像系统都接受。使用 -tc 7 表示 G4FAX;切换到 -tc 1 表示 LZW,或 -tc 3 表示 JPEG 压缩的 TIFF。

DocConverterX.exe "C:\contracts\*.doc" "C:\archive\" -cTIFF -tc 7

7. 转换为带自定义边距的横向 A4

当目标格式为 PDF 或 TIFF 时,纸张大小、方向和边距是标志而不是按文档设置。对于不适合纵向 Letter 的宽表格很有用。

DocConverterX.exe "C:\reports\*.doc" "C:\out\" -cPDF -ps A4 -po Landscape -TM 15 -LM 20 -BM 15 -RM 20

8. 用固定字体将纯文本渲染为 PDF

对于 *.txt 源,转换器必须自己选择字体。明确固定排版,使输出在不同机器上看起来一致,并打开 -WordWrap,使长行不会在右边距被裁剪。

DocConverterX.exe "C:\logs\*.txt" "C:\out\" -cPDF -FontName "Consolas" -FontSize 10 -FontStyle B -WordWrap

9. 带错误日志的无人值守运行

一旦 DocConverterX.exe 作为服务或计划作业运行,了解发生了什么的唯一方法就是日志。-log 抑制交互式错误对话框,并将失败写入您可以跟踪或抓取的文件。

DocConverterX.exe "C:\contracts\*.doc" "C:\out\" -cPDF -log "C:\logs\docconv.log"

10. 移除原始文件的日期戳输出文件夹

将目标路径中的 <DATE> 宏与 -do 结合使用,以在成功转换后删除原始文件 —— 对于应排到归档中的每日接收文件夹很有用。

DocConverterX.exe "C:\inbox\*.doc" "C:\archive\<DATE>\" -cPDF -do -log "C:\logs\intake.log"
立即下载!

更新 Fri, 01 May 2026

购买许可证

(仅 $750.00)



支持的转换列表:

  • Doc 转 PDF 命令行
  • Doc 转 HTML 命令行
  • Doc 转 文本 命令行
  • Doc 转 TIFF 命令行
  • Doc 转 JPEG 命令行
 
    • DocX 转 PDF 命令行
    • DocX 转 HTML 命令行
    • DocX 转 文本 命令行
    • DocX 转 TIFF 命令行
    • DocX 转 JPEG 命令行
 
  • Word 转 PDF 命令行
  • Word 转 HTML 命令行
  • Word 转 文本 命令行
  • Word 转 TIFF 命令行
  • Word 转 JPEG 命令行
 

关于 Total Doc Converter X 的常见问题 ▼

不需要。Total Doc Converter X 通过自带解析器直接读取 DOC、DOCX、DOCM、RTF 和 TXT。转换服务器上无需安装 Word、Office、Open XML SDK 或任何 Office Interop 组件。这正是客户从基于 Word Interop 的流程迁移到 Doc Converter X 的主要原因—无 Office 授权费、无 Word COM 服务器挂起导致的应用程序池崩溃,也无需维持一个常驻的无界面 Word 实例。
输入:DOC(Word 97–2003 二进制)、DOCX(Office Open XML)、DOCM(启用宏的 DOCX)、RTF、TXT(ANSI 和 Unicode)。输出:PDF(支持 AES-256 加密、密码保护、X.509 数字签名、逐项权限标志)、HTML(含嵌入图片和 CSS)、XHTML、XLS(提取表格至电子表格)、DOC、DOCX、RTF、TXT、Unicode TXT、JPG、TIFF(多页)、PNG。
Total Doc Converter X 提供 COM/ActiveX 接口,因此任何支持 COM 的语言都可以直接调用:PHP 中使用 new COM("DocConverter.DocConverterX"),.NET 中使用 new DocConverterX(),Python 中使用 win32com.client.Dispatch("DocConverter.DocConverterX"),Ruby 中使用 WIN32OLE.new('DocConverter.DocConverterX')。也可以从任何进程、调度器或 shell 脚本中调用 DocConverterX.exe 命令行程序。还提供 ConvertToStream 方法,可在 ASP/PHP Web 响应中直接流式输出 PDF。
Total Doc Converter 是面向工作站交互使用的桌面 GUI 版本。Total Doc Converter X 是服务器 SDK:无图形界面、无对话框、无最终用户交互。它授权用于无人值守的服务器端使用,包含用于应用集成的 ActiveX/COM 接口,并支持 Royalty-Free 许可证以便在您自己的产品中再分发。
可以。由于该转换器是带 COM 接口的常规 Windows 二进制程序,因此它能在所有运行 Windows 的环境下运行:IIS 应用程序池、Windows 容器、基于 Windows 运行时的 Azure App Service 或 Azure Functions、AWS EC2 Windows 实例以及本地 Windows Server。注意:ActiveX 组件仅为 32 位,因此通过 COM 调用时请将 IIS 应用程序池或 .NET 运行时配置为 32 位。命令行程序在 64 位 Windows 上无任何限制。
可以。使用 -mp "owner-pwd" 设置所有者密码,使用 -up "user-pwd" 限制文件打开。-perm 标志接受 PrintHighResPrintCopyModifyAnnotationFormFill 的任意组合。加密强度由 -EncryptStrength es256AES 控制。要进行数字签名,请传入 -PFXFile "C:\certs\acme.pfx" -PFXPass "cert-pwd" -SignLoc -SignCon -SignRes,将 X.509 证书附加到每个输出 PDF。
将程序指向文件夹掩码:DocConverterX.exe "C:\inbox\*.docx" "C:\out\" -cPDF。添加 -Recurse 进入子文件夹,添加 -kfs 在输出端镜像源文件夹结构,而不是把所有文件平铺到一个目录里。结合 -list "queue.txt" 可构建工作进程驱动的处理流水线,使用 -msuccess/-merror 可将已处理和失败的源文件分别路由到不同文件夹。
有。下载即为功能完整的 30 天试用版,所有输出格式、ActiveX 与命令行功能均已解锁—启动时无需信用卡和电子邮件。30 天后您再决定是否购买。许可证为一次性付款,可享终身更新和技术支持。
可以。将 .md 作为输出格式,转换器就会输出 GitHub-Flavored Markdown:Word 样式映射到 Markdown 结构(Heading 1..Heading 6 变成 #/##/###;项目符号与编号列表保留为列表;Quote 样式映射为 > 引用块),表格变成保留了合并单元格和多行表头的 GFM 表格,内嵌图片随旁保存并以 ![](image-001.png) 形式引用。YAML frontmatter 块承载 source_file、来自文档元数据的 titleauthorcreated/modified 时间戳、检测到的语言以及 binary hash。这是 CoolUtils RAG Adapter 的一部分 — 每款 Total Converter X 产品共享同一套 Markdown 约定。
它是与 Markdown 一并交付的可选旁路文件,遵循 IBM 主导的 RAG 工具使用的 Docling schema。对于 Word 文档,它会记录:表格边界矩形、列表嵌套层级(这样深层编号大纲仍可寻址)、每个样式的锚点映射回源文件、图片引用、用于溯源的 binary_hash,以及 chunks_hint 数组。在命令行中使用 -Docling 启用。JSON 与 Markdown 相互独立 — 您可以两者都送进索引,或只使用 .md
可以 — 无需任何适配器。.md 文件是带 YAML frontmatter 块的纯 GFM,因此 LangChain 的 UnstructuredMarkdownLoader、LlamaIndex 的 MarkdownReader、Haystack 的 MarkdownToDocument 与 Claude Code 的 MCP 文件工具均可直接读取。对于 Claude、ChatGPT 或任意聊天 UI,您可以将 Markdown 原样粘贴进上下文 — 标题展现文档结构,表格能渲染出来,frontmatter 给模型提供源文件名、作者与语言提示。
命令行:DocConverterX.exe "C:\inbox\*.docx" "C:\out\" -cMD -Docling -Recurse -kfs-cMD 选择 Markdown;-Docling 额外输出 .docling.json 旁路文件;-Recurse 遍历子目录;-kfs 在输出端镜像源文件夹树。COM 调用:obj.Convert("contract.docx", "contract.md", "-cMD -Docling")。生成的 Markdown 可直接分块、嵌入并在任意向量存储中建立索引。

立刻开始工作!

下载试用版,只需几分钟即可转换文件。
无需信用卡或电子邮件。

⬇ 下载试用版 Windows 7/8/10/11 • 135 MB
Pro Suite

完整注册版的主要特点

  • 多合一转换器套装(doc 到 pdf, doc 到 html, doc 到 xls, doc 到 jpg, doc 到 tiff, doc 到 txt)
  • 支持所有类型的 doc 文件:Word, DOC, DOCX, DOCM, RVF, TXT
  • 服务器版本 - 无 GUI
  • 支持自动化服务器、Jenkins 等
  • 支持的语言包括任何支持 Web 服务的语言,如 .NET (2.00, 3.5, 4.00)、Ruby、PHP 和 Java。
  • 通过 ActiveX 接口为所有传统编程语言(Visual Basic 6 或 Delphi)以及脚本语言(如 VBscript)提供访问。
  • 多线程
  • 可以将多个文件合并为一个
  • 加密最终的 PDF 文件
  • 添加分页或水印
  • 提供多个图像压缩级别
  • 为每种文件类型智能自动生成设置

    您的应用程序需要 Doc 转换功能吗?

    获取免版税许可证。它允许您将 Total Doc ConverterX 集成到您的软件中并进行分发。RFL 是按项目许可的(无论有多少开发人员参与)。
    通过联系表单申请。


带有内置API支持的应用程序列表