任何到 PDF、DOC、TIFF、XPS。服务器版。
Windows
2000/2003/Vista
7/8/10/11
and
2012/2016/2019/2022 Server
and
Docker/Citrix/Wine
Coolutils Converter X 是一款通用的服务器端 SDK,可接收 30 余种输入文件类型 — PDF、DOCX、XLSX、HTML、MHT、EML、MSG、TXT、RTF、EPS、XPS、PCL、图像等等 — 并输出 PDF、DOC、TIFF 或 XPS。一个二进制文件即可替代一整套针对特定格式的库;服务器上无需安装 Microsoft Office、Adobe Acrobat、Outlook 或其他外部运行时。它以静默方式运行:没有图形界面,没有对话框,没有弹窗。Coolutils Converter X 同时提供命令行二进制文件和 ActiveX/COM 接口,可无缝集成到 ASP、PHP、.NET、Python、Ruby、Java 以及任何支持 COM 的后端中。
完整的输入格式覆盖:
输出格式:PDF(支持 AES-256 加密、密码保护、按权限标志、X.509 数字签名、PDF/A 归档配置文件)、DOC、TIFF(单页或多页)、XPS。Bates 式编号戳记、自定义页眉/页脚(日期、页数、保密戳记、公司徽标)以及水印可统一应用于每一种输入格式 — 无论源文件是 DOCX、EML、JPEG 还是 HTML 页面,使用的都是同一组参数。
多用户友好:在 Windows 服务器上一次安装,即可将转换功能作为服务向整个网络开放,或作为 Web 端点向外部客户提供。多线程引擎以最高速度批量处理。兼容 IIS、Docker、Citrix 和 Wine。
当您的应用程序需要接受任意用户上传时,Coolutils Converter X 是正确的选择 — 您无需为每一种格式维护独立的代码路径。一次 Convert(src, dest, params) 调用即可处理全部内容。免费试用(30 天试用期,无任何限制),您会发现它确实物有所值。
当前支持的部分输入到输出组合:
|
|
|
LLM 智能体(Claude、ChatGPT、Cursor、Cline)和检索框架(LangChain、LlamaIndex、Haystack)并不读取 XLSX、PDF、MSG 或 DWG,它们读取的是文本。市面上的转换器 — pandoc、libreoffice --convert、pdftotext — 会把输入压成一根字符串,丢掉结构:工作表层级、合并单元格、公式、单位、表头、作者与语言元数据。检索层最终拿到的是噪声。
CoolUtils RAG Adapter 是所有 Total Converter X 产品共享的 Markdown 约定。给任意 X 转换器加上 -cMD,您就能得到一份干净的 GitHub-Flavored Markdown 文件,并带有 YAML frontmatter 块;再加上 -Docling,就会同时生成一份带类型信息的 .docling.json 旁路文件。输出可直接进入您的向量存储 — 无需胶水代码,也无需自定义加载器。
.md) — GitHub-Flavored:表格、围栏代码块、任务列表。文档结构(workbook → sheets、PDF → sections、mailbox → folders → messages、CAD drawing → layers)映射到 # / ## / ### 标题,使得分块器在语义边界处切分,而不会切在表格中间或段落中间。
source_file、format(MIME)、generator、created、结构性计数(sheets、pages、messages、layers)、检测到的 languages、若存在则包含 authors,以及源文件的 binary_hash 用于溯源。
.docling.json 旁路文件 — 符合 Docling schema 的 JSON:带单位的类型化列(EUR、pcs、kWh、%、日期)、规范化公式(=qty*unit_price)连同原始单元格坐标(of:=[.C5]*[.D5])、表格边界矩形、页/工作表锚点,以及分块器可读取的 chunks_hint 数组。
UnstructuredMarkdownLoader、LlamaIndex 的 MarkdownReader、Haystack 的 MarkdownToDocument、Claude Code 的 MCP 文件工具,以及 Cursor 的 @-file 工作流均可直接消费输出。
那些竞品解析器在 PDF 和 Office 上覆盖得还算不错,但在长尾格式上明显薄弱。CoolUtils 在上游的强项恰恰是长尾 — 200 多种格式,其中包括智能体常常踩坑的那些:XLSB、OFX、DWG、DXF、HPGL、PST、OST、MSG、EML、MBOX、MAPI XML、.pages、.numbers、ODS、Lotus WK2、DBF、EPS、XPS、PCL。有了 RAG Adapter,您的流水线无需为每种格式准备一种加载器 — CoolUtils 触及的一切都将变成同一套约定下的 Markdown。
|
|
|
.ods 经过 RAG Adapter 后输入:q4-forecast.ods,一个包含两个工作表、带双语表头、其中一列为公式的工作簿。
Markdown 正文(q4-forecast.md):
--- source_file: q4-forecast.ods format: application/vnd.oasis.opendocument.spreadsheet generator: TotalExcelConverterX 6.2 (CoolUtils RAG Adapter) created: 2026-05-25T10:14:22Z sheets: 2 languages: [en, ru] binary_hash: sha256:1f4c…b9e2 --- # q4-forecast ## Summary | Период / Period | Выручка / Revenue (EUR) | Себестоимость / COGS (EUR) | Маржа / Margin (EUR) | |-----------------|------------------------:|---------------------------:|---------------------:| | Oct 2026 | 124,300 | 78,400 | 45,900 | | Nov 2026 | 138,750 | 82,100 | 56,650 | | Dec 2026 | 161,200 | 91,300 | 69,900 | ## Forecast | SKU | Qty (pcs) | Unit price (EUR) | Line total (EUR) | |-------|----------:|-----------------:|-----------------:| | A-100 | 420 | 12.50 | 5,250.00 | | A-200 | 180 | 34.00 | 6,120.00 | | B-050 | 95 | 89.90 | 8,540.50 |
旁路文件(q4-forecast.docling.json,节选):
{
"schema_version": "docling-1.0",
"source": { "file": "q4-forecast.ods", "mime": "application/vnd.oasis.opendocument.spreadsheet", "binary_hash": "sha256:1f4c…b9e2" },
"tables": [
{
"sheet": "Forecast",
"anchor": { "sheet_index": 1, "range": "A1:D4" },
"columns": [
{ "name": "SKU", "type": "string" },
{ "name": "Qty", "type": "integer", "unit": "pcs" },
{ "name": "Unit price", "type": "decimal", "unit": "EUR", "scale": 2 },
{ "name": "Line total", "type": "decimal", "unit": "EUR", "scale": 2,
"formula": "=qty*unit_price",
"formula_original": "of:=[.B2]*[.C2]" }
],
"chunks_hint": [ { "rows": "1-4", "header_rows": 1 } ]
}
]
}
LangChain(Python):
from langchain_community.document_loaders import UnstructuredMarkdownLoader
docs = UnstructuredMarkdownLoader("q4-forecast.md").load()
# YAML frontmatter is preserved as document metadata; headings drive splits.
LlamaIndex(Python):
from llama_index.core import SimpleDirectoryReader
docs = SimpleDirectoryReader("./rag-input", required_exts=[".md"]).load_data()
# Drop .md + .docling.json next to each other; the typed columns
# stay queryable through the Docling-aware reader.
Claude Code(MCP,无需客户端代码):
$ CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\rag\" -cMD -Docling -Recurse $ claude # then: "Read q4-forecast.md and summarise margin trends."
下方列出的每个 X 系列转换器都内置 RAG Adapter — 相同的 -cMD 与 -Docling 参数、相同的 frontmatter、相同的旁路文件 schema:
RAG Adapter 从每款产品的 6.2 版本起提供。现有许可证持有者可作为免费更新获取;新购买者则随产品附带 — 没有单独的 SKU,也没有按格式收费的附加包。
"感谢 Coolutils Converter X。它能在我们的服务器上处理大批量任务,性能让我们非常满意。"
Ji Prasertcharoensuk
IT Lead
"我使用 Coolutils Converter X 将 PDF、DOC 和 JPG 扫描件转换为 PDF/A,用于我们的电子文档系统。从客户的角度来看,它非常直观易用。"
Tom Cioni
GammaView LLC
"客户上传任意类型的文件:DOCX、XLSX、MSG、JPEG、HTML 抓取页面,甚至 PCL 打印队列。无论源格式如何,我们都需要每次上传输出一个 PDF。Coolutils Converter X 是唯一一个能用同一个 Convert() 调用处理所有类型的二进制文件。我们替换了三个 Aspose 库加上一套 Office-Interop 备用方案。在生产环境中已运行五年,在我们的硬件上吞吐量约为每小时 8,000 个混合类型文件。"
Maxim G.
Senior Backend Developer at a document-management SaaS
"我们以混合格式归档客户往来通信:电子邮件为 MSG,合同为 DOCX,扫描件为 TIFF,网页打印件为 MHT。所有内容都必须以数字签名的 PDF/A 形式落地到我们的 DMS。-pdfa 加上 -PFXFile/-PFXPass 在每种输入格式上都能统一工作,这意味着无论源格式如何,我们的流水线都只是一次二进制调用。无界面运行于 Windows Server Core 之上,无需 Office、无需 Acrobat,没有意外。"
Bridget T.
DevOps Engineer at a regulatory-archive provider
"我们以 Royalty-Free License 将 Coolutils Converter X 打包到我们的接收门户产品中。一次性的项目费用只是分别授权五个 Aspose 产品成本的一小部分。我们的安装程序会发布并注册 ActiveX,应用程序直接调用,最终用户只能看到我们自己的界面。32 位 ActiveX 的限制让我们花了几天时间重做流水线,但当我们咨询变通方案时,技术支持响应及时。"
Henrique A.
Independent Software Vendor
Coolutils Converter X 附带 CoolUtilsConverterX.exe,这是一个可以从脚本、计划任务、CI 运行器或任何后端服务驱动的控制台二进制程序。输出格式为 PDF、TIFF、DOC 和 XPS;输入格式会在 GUI 支持的所有格式中自动检测。下面的配方涵盖了我们最常从 SDK 客户那里听到的场景。
最简单的调用方式 —— 一个源文件、一个目标文件、一个目标格式。
CoolUtilsConverterX.exe "C:\inbox\report.docx" "C:\out\report.pdf" -cPDF
处理文件夹中所有匹配的文件。掩码可以混合多种格式 —— CoolutilsConverterX 接受完整的输入列表,因此一次运行可以同时吞下 Word、HTML、RTF、图像和电子邮件文件。
CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\out\" -cPDF
上传管道经常给您扩展名错误或缺失的文件。-filesig 告诉转换器查看文件头而不是文件名。
CoolUtilsConverterX.exe "C:\uploads\*.*" "C:\out\" -cPDF -filesig
在多核机器上并行化队列。-threads 0 自动选择最佳线程数;指定数字以设置上限。
CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\out\" -cPDF -threads 0
结合 -IgnoreInvalidSource 使用,如果您宁愿跳过坏文件也不愿中止整个运行。
标准的后端模式:监视器将文件放入 inbox,转换器清空它,处理过的文件落到 done,无法处理的文件落到 quarantine 等待审查。
CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\out\" -cPDF -msuccess "C:\done" -merror "C:\quarantine" -threads 0
-combine 将每个输入合并到单个 PDF 中;-dco TOC 从源文件名生成可点击的目录。
CoolUtilsConverterX.exe "C:\reports\*.*" "C:\out\compendium.pdf" -cPDF -combine -dco TOC
添加 -dco EveryFileNewPage 以确保每个源都从新页面开始。
对于电子邮件附件大小限制或存储分层,设置一个大小上限,转换器将根据需要生成多个连续的 PDF。
CoolUtilsConverterX.exe "C:\reports\*.*" "C:\out\bundle.pdf" -cPDF -combine -pdflimit 10485760
该数字以字节为单位 —— 10485760 是 10 MB。输出文件名会自动递增。
用于需要符合 ISO 19005 PDF/A 的记录管理工作流。-pdfaver 2u 针对 PDF/A-2u;支持的变体为 1b、2b、2u、3b、3u。
CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\archive\" -cPDF -pdfa -pdfaver 2u -PDFAuthor "Acme Corp" -PDFTitle "Q3 Records" -PDFSubject "Records retention 2026" -FontEmbedding Full
向第三方发送敏感文档的标准做法:所有者密码锁定编辑/打印权限,用户密码控制文件打开,AES-256 加密替换旧版 RC4 默认设置。
CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\out\" -cPDF -mp "owner-pwd" -up "user-pwd" -perm Print -perm Copy -EncryptStrength es256AES
多次传递 -perm 以授予 Print、Copy、Modify、Annotation、FormFill、HighResPrint 的组合。
目标路径接受 <DATE> 和 <TIME> 宏,因此每次运行都会写入自己的存储桶,无需额外的脚本。
CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\out\<DATE>_<TIME:hhmm>\" -cPDF -log "C:\logs\cucx.log" -verbosity detail -logmode append
对于跨 cron 作业的可重复参数集,将标志提升到配置文件中并使用 -optionfile "C:\configs\nightly.opt" 代替。
new COM("CoolConverter.CoolConverterX"),在 .NET 中使用 new CoolConverterX(),在 Python 中使用 win32com.client.Dispatch("CoolConverter.CoolConverterX"),在 Ruby 中使用 WIN32OLE.new('CoolConverter.CoolConverterX')。此外,命令行二进制文件 CoolConverterX.exe 可以从任何进程、调度器或 shell 脚本中调用。还可通过 ConvertToStream 进行直接流式输出,用于 ASP/PHP 网页响应。-pdfa 启用 ISO 19005(PDF/A)合规性。-PFXFile "C:\certs\acme.pfx" -PFXPass "cert-pwd" -SignLoc -SignCon -SignRes 附加带元数据的 X.509 数字签名。使用 -WatermarkText 或 -WatermarkImage 添加水印(文本或图像);使用 -HeadText/-FootText 配合占位符 [page]、[date]、[time] 添加 Bates 页眉/页脚戳记。同样的参数适用于任何输入格式。CoolConverterX.exe "C:\inbox\*.*" "C:\out\" -cPDF。转换器会根据扩展名和内容检测每个文件的格式,应用相应的解析器,并生成统一的 PDF 输出。-Recurse 遍历子目录,-kfs 在输出端镜像文件夹结构,-list "queue.txt" 读取队列文件,-msuccess/-merror 将处理成功和失败的源文件分流到不同的文件夹中,便于无人值守的工作流水线使用。-cMD,您就能得到一份带 YAML frontmatter 块(source、MIME、generator、结构性计数、languages、authors、binary hash)的 GitHub-Flavored Markdown 文件。再加上 -Docling,还会同时输出一份带类型信息的 .docling.json 旁路文件:带单位(EUR、pcs、%)的列、规范化公式、页面/工作表锚点,以及供分块器使用的 chunks_hint 数组。输出可被 LangChain、LlamaIndex、Haystack、Claude Code MCP 与 Cursor 直接消费 — 无需自定义加载器,也无需胶水代码。pandoc、pdftotext 与 libreoffice --convert 都会将输入压平成一根字符串。电子表格层级、合并单元格、公式、单位、双语列标题、邮箱文件夹结构、CAD 图层 — 全部丢失。检索层随后索引到的只是噪声。RAG Adapter 保留了结构(标题层级承载 workbook → sheet、PDF → section、mailbox → folder → message、CAD drawing → layer),在旁路文件中保留带单位的类型化列,并加入用于溯源的 binary hash。相比 Docling、Unstructured.io、LlamaParse 与 Marker,胜在长尾:XLSB、OFX、DWG、PST、MAPI XML、.pages、.numbers、Lotus WK2 — 这些是上述工具要么跳过、要么处理得很差的格式。-cMD / -Docling 参数以及相同的 frontmatter 与旁路文件 schema:Total HTML Converter X、Total PDF Converter X、Total Doc Converter X、Total Excel Converter X、Total CSV Converter X、Total Mail Converter X、Total Mail Converter Pro X、Total Outlook Converter X、Total Outlook Converter Pro X、Total Image Converter X(OCR → Markdown)、Total CAD Converter X(DWG/DXF 图层与文字提取)、Total XML Converter X,以及用于混合格式批处理的 Coolutils Converter X 自身。RAG Adapter 从 6.2 版本起作为现有许可证持有者的免费更新提供。CoolUtilsConverterX.exe "C:\inbox\*.*" "C:\rag\" -cMD -Docling -Recurse -filesig -threads 0。-cMD 选择 Markdown 输出,-Docling 输出 JSON 旁路文件,-Recurse 遍历目录树,-filesig 根据文件头检测格式(这样即使上传流水线中扩展名不对也能工作),-threads 0 使用全部核心。配合 -msuccess 与 -merror,可将处理成功与失败的源文件分别路由到不同文件夹,便于无人值守的索引工作流使用。