Logo
首页 产品 支持 联系 关于我们
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware

HTML 文件批量转换工具(服务器端)

在Web服务器上将HTML转换为PDF, DOC, TXT, TIFF, JPEG。无GUI。

带有ActiveX的Total HTML Converter X | CoolUtils

Windows
2000/2003/Vista
7/8/10/11
and
2012/2016/2019/2022 Server
and
Docker/Citrix/Wine

Total HTML Converter X 是一款服务器端 SDK,可将 HTML 文件和实时 URL 转换为 PDF、DOC、RTF、XLS、TIFF、JPG、PNG 和 TXT — 完整的 CSS 渲染,无需在服务器上安装无头 Chrome,也无需依赖打印服务。它以静默方式运行:无 GUI、无对话框、无弹窗。Total HTML Converter X 同时提供命令行二进制文件和 ActiveX/COM 接口,因此可直接嵌入 ASP、PHP、.NET、Python、Ruby、Java 以及任何支持 COM 的后端。

两种源模式:本地 HTML/MHT 文件路径,或由转换器直接抓取的远程 URL(适用于"将实时页面渲染为 PDF"的场景)。输出格式覆盖:

  • PDF — 支持数字签名(X.509 PFX)、AES 加密、密码保护和按权限标志控制
  • DOC / RTF — 保留版式、表格和内嵌图像
  • TIFF / JPG / PNG — 用于存档或缩略图的栅格化输出
  • XLS — 将 HTML 表格提取为结构化电子表格
  • TXT — 纯文本正文提取

Total HTML Converter X 识别所有 HTML 标签,包括通过 CSS 1/2 样式控制分页符,支持 IE 风格的页眉页脚(日期、时间、页数、自定义水印),自动将 HTML 宽度适配到所选 PDF 页面尺寸(在打印宽幅 HTML 表格时尤为关键),可提取元数据用于数据库索引,并支持以文件夹掩码或队列文件批量处理静态文件和实时 URL。

多用户友好:同一台 Windows 服务器既可在 LAN 上运行客户端-服务器部署,也可将转换功能作为 Web 服务对外提供。多线程引擎以最高速度处理批量任务。兼容 IIS、Docker、Citrix 和 Wine。

免费试用(30 天试用期,无功能限制),亲自体验它的真正价值。

当前支持的部分文件格式转换:

    HTML / URL 转文档
  • HTML 转 PDF(数字签名)
  • URL 转 PDF(实时页面渲染)
  • HTML 转 DOC / RTF
  • HTML 转 TXT
    HTML 转图像
  • HTML 转 TIFF(多页)
  • HTML 转 JPG
  • HTML 转 PNG
  • 渲染时自动适配宽度
    表格与数据
  • HTML 表格转 XLS
  • 元数据提取
  • CSS 1 / CSS 2 分页符控制

面向 AI / RAG 流水线的输出 — Markdown + Docling 旁路文件

LLM 智能体(Claude、ChatGPT、Cursor、Cline)和检索流水线(LangChain、LlamaIndex、Haystack)并不读取 HTML — 它们读取的是文本。Total HTML Converter X 会把页面和实时 URL 写成 GitHub-Flavored Markdown,配以结构化的 frontmatter 与可选的 Docling 兼容旁路文件,让页面进入您的向量存储时保留其层级、标题、链接和表格 — 而不是变成混杂着 CSS 噪声与导航边栏的扁平文字。

选择 Markdown 输出后您会得到:

  • 干净的 GFM 正文 — HTML 标题(h1h6)映射到 Markdown 标题,表格变成 GFM 表格,列表保留为列表,锚点保留为 [text](url),内联代码 / 预格式化块保留为围栏代码块
  • 样板内容已剥离 — 导航栏、页脚、Cookie 横幅与分析脚本被排除在外;只有文章正文进入索引
  • YAML frontmattersource_filesource_urlformat(MIME)、titlecanonical、检测到的 languagegeneratorcreated,以及用于溯源的 binary_hash
  • 章节感知的层级结构 — 页面的标题层级驱动 Markdown 的 # / ## / ###,因此 RAG 分块器会在语义边界处切分,而不会切在章节中间
  • 可选的 .docling.json 旁路文件 — 结构化 JSON:表格边界矩形、链接清单,以及供分块器使用的 chunks_hint
  • LangChain / LlamaIndex / Haystack / Claude MCP 开箱即用 — 无需胶水代码,也无需维护无头浏览器流水线

这就是 CoolUtils RAG Adapter — 一套统一的 Markdown 约定,由每款 Total Converter X 产品共享。完整规范、样例 .md + .docling.json 以及集成代码片段,请见 Coolutils Converter X — RAG Adapter 页面。

立即下载!

(包括30天免费试用)

购买许可证

(仅 $750.00)



Total HTML Converter X 示例

使用 Total HTML Converter X 和 .NET 转换 HTML 文件


string src  = @"C:\test\Source.html";
string dest = @"C:\test\Dest.pdf";

var cnv = new HTMLConverterX();
cnv.Convert(src, dest, "-cPDF -log c:\\test\\HTML.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

使用 Total HTML Converter X 在 Web 服务器上转换 HTML 文件

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\HTMLConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.html";
                var outPath = Path.GetTempFileName() + ".pdf";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cPDF";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
关于 Azure Functions 的更多信息。

使用 Total HTML Converter X 在 Web 服务器上转换 HTML 文件和实时 URL

dim C
Set C=CreateObject("HTMLConverter.HTMLConverterX")
C.Convert "c:\source.html", "c:\dest.jpg", "-cJPG -log c:\html.log"
C.Convert "https://www.coolutils.com/", "c:\URL Page.pdf", "-cPDF -log c:\html.log"
Response.Write C.ErrorMessage
set C = nothing

直接从 ASP 流式传输生成的 PDF

dim C
Set C=CreateObject("HTMLConverter.HTMLConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.pdf"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.html", "C:\www\ASP", "-cpdf -log c:\html.log")
set C = nothing

使用 PHP 和 Total HTML Converter X 转换 HTML 和 MHT 文件

$src="C:\\test\\test.html";
$dest="C:\\test\\test.pdf";
if (file_exists($dest)) unlink($dest);
$c= new COM("HTMLConverter.HTMLConverterX");
$c->convert($src,$dest, "-cPDF -log c:\\HTML.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

使用 Total HTML Converter X 和 Ruby 转换 HTML 文件

require 'win32ole'
c = WIN32OLE.new('HTMLConverter.HTMLConverterX')

src = "C:\\test\\test.html"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\HTML.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

使用 Total HTML Converter X 和 Python 转换 HTML 文件

import win32com.client
import os.path

c = win32com.client.Dispatch("HTMLConverter.HTMLConverterX")

src  = "C:\\test\\test.html"
dest = "C:\\test\\test.pdf"

c.convert(src, dest, "-cPDF -log c:\\test\\HTML.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

使用 Pascal 和 Total HTML Converter X 转换 HTML 文件

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('HTMLConverter.HTMLConverterX');
  c.Convert('c:\test\source.html', 'c:\test\dest.pdf', '-cPDF -log c:\test\HTML.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

使用 Total HTML Converter X 在 Web 服务器上转换 HTML 文件

var c = new ActiveXObject("HTMLConverter.HTMLConverterX");
c.Convert("C:\\test\\source.html", "C:\\test\\dest.pdf", "-cPDF");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

使用 Total HTML Converter X 和 Perl 转换 HTML 文件

use Win32::OLE;

my $src  = "C:\\test\\test.html";
my $dest = "C:\\test\\test.pdf";

my $c = CreateObject Win32::OLE 'HTMLConverter.HTMLConverterX';
$c->convert($src, $dest, "-cPDF -log c:\\test\\HTML.log");
print $c->ErrorMessage if -e $dest;

quote

HTML 文件批量转换工具(服务器端) 客户评价 2026

评价
基于客户评价评分4.7/5
5 Star

"我选择 Total HTML Converter X 有几个原因。首先,你们能够提供我们所需的一些功能,而其他转换器表示无法做到(包括在每页保持相同页眉以及不在跨页时拆分表格行的能力)。其次,在我们购买产品之前,你们就非常支持并迅速响应我们的请求。第三,当我们说明情况后,你们愿意调整第二个免版税许可证的价格。第四,你们看起来非常以客户为中心,我感觉你们在我们购买产品后不会忽视我们 — 事实证明我是对的!"

5 Star Andy Poulsen
www.asp-inno.com

"我们在自己的模板引擎中将每日投资组合报告渲染为 HTML,然后通过 Total HTML Converter X 处理 HTML,生成带有数字签名、可交付给客户的 PDF。-PFXFile/-PFXPass 签名场景只需调用一次二进制文件,无需单独的后处理。每晚约 4,000 份报告,多次运行结果一致。我们替换了一个 wkhtmltopdf 流水线,原来在异步加载字体时会崩溃;内置渲染器开箱即用。"

5 Star Stefan H.
Senior Backend Developer at a financial-reporting platform

"客户从我们的 CMS 导出文章,希望以 PDF 形式存档。Total HTML Converter X 配合 -HeadText/-FootText 在每一页应用发布元数据,自动适配 HTML 宽度的功能让编辑表格无需为每个模板编写自定义 CSS。在 Windows Server Core 上无界面运行,没有 Chromium,也没有意外。已在生产环境运行五年,对于典型文章 HTML,我们硬件上的吞吐量约为每秒 80 页。"

5 Star Margit V.
DevOps Engineer at a CMS platform

"我们在内联网发布产品中以免版税许可证的方式捆绑了 Total HTML Converter X。一次性按项目收费仅为基于 wkhtmltopdf 的商业封装产品所要求的重新分发授权费的一小部分。我们的安装程序部署并注册了 ActiveX,应用直接调用它,最终用户只看到我们自己的 UI。32 位 ActiveX 限制使我们花了几天时间重做流水线,但当我们询问解决方法时,技术支持响应迅速。"

4 Star Carlos P.
Independent Software Vendor

"面向客户的仪表盘是 HTML;部分用户希望保留 PDF 快照作为存档。我们提供了一个'下载为 PDF'的链接,调用 Total HTML Converter X 处理已渲染仪表盘的实时 URL。转换器通过基于 cookie 的会话登录,并生成完全相同的 PDF 渲染。CSS 分页符控制被精确遵循,因此多节仪表盘可以干净利落地分页。CLI 稳定、文档完善,-log -verbosity detail 让调试变得轻松。"

5 Star Akari N.
Lead .NET Developer at a partner-portal SaaS


谁在使用 Total HTML ConverterX?

通过 ActiveX 在 Web 服务器上将 HTML 转换为 PDF、DOC 和图像的开发人员和 IT 团队

Web Applications

在线 HTML 转 PDF 服务

通过 ActiveX 为您的 Web 应用添加 HTML 转换功能

Web 开发人员将 Total HTML ConverterX 集成到 ASP、PHP 或 .NET 应用程序中,在服务器上将用户提交的 HTML 文件转换为 PDF、DOC 或图像。多个用户可同时进行转换而不中断——转换器静默运行并自动返回结果。

Report Generation

服务器端报告导出

将 HTML 报告转换为带数字签名的 PDF

企业应用程序在服务器上生成 HTML 报告,并使用 Total HTML ConverterX 将其转换为 PDF 进行分发。添加数字签名以确保文档真实性,应用自定义水印,并将宽 HTML 表格自动适配到所选页面尺寸——所有操作均作为自动化报告流水线的一部分完成。

Document Management

DMS HTML 接入

将 HTML 内容转换为标准格式用于归档

文档管理系统使用 Total HTML ConverterX 将传入的 HTML 文件、保存的网页和邮件模板转换为标准化存储用的 PDF 或 TIFF。转换器识别所有 HTML 标签和 CSS 样式,生成带页眉、页脚和元数据提取(用于数据库索引)的忠实输出。

Multi-User Networks

网络转换服务

为本地网络上的所有用户提供 HTML 转换服务

组织将 Total HTML ConverterX 作为本地网络上的客户端-服务器应用程序部署。各部门员工通过共享服务提交 HTML 文件,转换为 PDF、XLS 或 TIFF——无需在每台工作站上安装桌面转换器。

IT & Automation

自动化 HTML 流水线

在服务器上通过命令行批量转换 HTML 文件

IT 团队通过命令行在计划批处理任务和自动化工作流中运行 Total HTML ConverterX。来自网络爬虫、CMS 导出或应用程序日志的 HTML 输出在到达时即被转换为 PDF 或图像。错误保存至日志文件用于监控——无弹出窗口,无需用户交互。

Total HTML Converter X 的独特选项


html
Total HTML Converter X 不仅限于 HTML。它还支持 HTML, MHT, HTM, XHTML 文件。

java
使用 Total HTML Converter,您可以在页面上启用或禁用 Java 脚本。这个方便的选项将为您节省数小时的时间!

css
Total HTML Converter X 支持所有 CSS 样式,并且您总是可以获得精确的结果。

slow scripts
Total HTML ConverterX 可以 停止慢速脚本。如果您的页面中有循环,它仍然可以在合理的时间内转换。

openoffice
想切换到 OpenOffice?Total HTML ConverterX 可以帮助您在几秒钟内将成千上万个 HTML 文件转换为 ODT。

combine html
将多个 HTML 文件 合并为一个多页的 TIFF 或 PDF 文件,使用我们的 HTML Converter。

fit-to-page
Total HTML ConverterX 具有页面适配选项。这非常方便:您可以转换数百个不同的 HTML 文件并获得排版完美的文档。

html to jpeg
HTML 转 JPEG:设置 JPEG 图像的质量以平衡文件大小。

interface
想要将 HTML 转换器添加到您的应用程序中?我们的 ActiveX 将大大简化该过程。
html formats
输出格式:DOC、PDF、XHTML、TXT、XLS、RTF、TIFF、JPEG、PNG、ODT、EMF、SVG!

html converter
当您将 HTML 转换为 TIFF 时,您可以选择任何压缩类型(LZW、RLE、JPEG、二级压缩 CCITT)。

qr code
Total HTML Converter X 允许您在输出文件中添加二维码。

html watermark
在输出文件的页眉或页脚中添加文本或图像水印(您的徽标或任何其他图像)。它也适用于打标。

page
在输出文件的每一页上添加分页器,以完美排序(文件夹中的文件可进行顺序编号)。

html load images
告诉 Total HTML ConverterX 是否需要打印背景以最小化文件大小。

html to pdf
当您将 HTML 转换为 PDF 时,可以设置用户权限、为文件添加密码保护或使用数字签名进行签名。获得 PDF、PDF/A 和无搜索功能的 PDF。

server
我们为 Web、PHP、C++、.NET、C# 提供了大量示例。您永远不会在代码行中迷失。

cmd
Total HTML ConverterX 在网络服务器上运行,无需人工干预。没有弹出窗口,错误会写入日志文件。

命令行示例

Total HTML ConverterX 附带 HTMLConverterX.exe,这是一个可以从 .bat 脚本、计划任务、PHP/.NET 后端或任何服务器端工作进程调用的控制台二进制程序。标志集镜像 GUI 版的 HtmlConverter.exe;完整参考请参阅命令行文档。下面的配方涵盖了我们最常从 SDK 客户那里听到的请求。

1. 将单个 HTML 文件转换为 PDF

最简单的调用 —— 一个源文件、一个输出、一个目标格式。

HTMLConverterX.exe "C:\pages\index.html" "C:\out\index.pdf" -cPDF

2. 按掩码批量处理文件夹

处理文件夹中的每个 HTML 文件,并将 PDF 放入同级输出目录。

HTMLConverterX.exe "C:\pages\*.html" "C:\out\" -cPDF

将掩码替换为 *.mht*.mhtml*.htm 以选择不同的源格式。

3. 直接将实时 URL 渲染为 PDF

源参数可以是 URL,而不仅仅是文件路径。Chrome 渲染引擎处理现代 CSS、Web 字体和 JavaScript 密集型页面。

HTMLConverterX.exe "https://www.coolutils.com" "C:\out\coolutils.pdf" -cPDF -engine chrome

4. 递归项目树并镜像其文件夹结构

文档站点和导出的 wiki 很少存在于一个平面文件夹中。-Recurse 遍历子目录;-kfs 在输出端重新创建相同的树,而不是将每个文件展平到一个桶中。

HTMLConverterX.exe "C:\docs\manual\*.html" "C:\out\manual\" -cPDF -Recurse -kfs

5. 将多个 HTML 文件合并为一个多页 PDF

典型的导出整个网站作业:数十个属于一起的页面。-combine 按源文件顺序合并它们,-toc 生成目录。

HTMLConverterX.exe "C:\docs\manual\*.html" "C:\out\manual.pdf" -cPDF -combine -toc -sort name

当目标是多页 TIFF 时,请使用 -Multipage 而不是 -combine

6. 自定义页眉、页脚和页码

报告通常需要在每页顶部有标题,在底部有"第 1 页/共 10 页"。[page][date] 占位符在渲染时展开。

HTMLConverterX.exe "C:\pages\*.html" "C:\out\" -cPDF -HeadText "Acme Quarterly Report — [date]" -HeadAlign center -FootText "Page [page]" -FootAlign right

7. 带水印的密码保护 PDF

向客户发送草稿的标准做法:所有者密码锁定编辑/打印权限,用户密码控制文件打开,水印标记每页。

HTMLConverterX.exe "C:\pages\*.html" "C:\out\" -cPDF -mp "owner-pwd" -up "user-pwd" -perm Print -wmt "CONFIDENTIAL" -wmr 45 -wtr 30

CopyModifyAnnotationFormFillHighResPrint 的任意组合替换 Print,以准确授予您想要的权限。

8. 在每个输出 PDF 上添加数字签名

对于需要可验证签名者的合同、发票和其他文档。PFX 文件保存证书;-PFXPass 解锁它。

HTMLConverterX.exe "C:\pages\contract.html" "C:\out\contract.pdf" -cPDF -PFXFile "C:\certs\acme.pfx" -PFXPass "cert-pwd" -SignName "Acme Legal" -SignLoc "New York, NY" -SignRes "Approved by counsel"

9. 带元数据的 PDF/A 归档输出

用于需要符合 ISO 19005 PDF/A 文件且具有适当创作元数据的记录管理工作流。

HTMLConverterX.exe "C:\pages\*.html" "C:\archive\" -cPDF -pdfa -PDFAuthor "Acme Inc." -PDFTitle "Knowledge Base 2026" -PDFSubject "Support articles snapshot"

10. 从带服务器日志的列表文件驱动队列

当工作进程写入队列文件而转换器消耗它时,您不希望在命令行上编码每个路径。-list 从文本文件中读取文件掩码(每行一个);-verbosity detail 每个文件写一行日志;-logmode append 在多次运行之间保留历史。

HTMLConverterX.exe -list "C:\queues\batch.txt" "C:\out\" -cPDF -log "C:\logs\htmlconv.log" -verbosity detail -logmode append
立即下载!

更新 Fri, 01 May 2026

购买许可证

(仅 $750.00)



支持的转换列表:

 
  • HTM 到 Doc 命令行
  • HTM 到 JPEG 命令行
  • HTM 到 RTF 命令行
  • HTM 到 PDF 命令行
  • HTM 到 TIFF 命令行
  • HTM 到 文本 命令行
  • HTM 到 XLS 命令行
  • HTM 到 Unicode 文本 命令行
 
  • MHT 到 Doc 命令行
  • MHT 到 JPEG 命令行
  • MHT 到 RTF 命令行
  • MHT 到 PDF 命令行
  • MHT 到 TIFF 命令行
  • MHT 到 文本 命令行
  • MHT 到 PNG 命令行
  • MHT 到 XLS 命令行
  • MHT 到 Unicode 文本 命令行

关于 Total HTML Converter X 的常见问题 ▼

不需要。Total HTML Converter X 拥有自己的 HTML 渲染引擎和内置 CSS 1/2 布局引擎。您不需要在转换服务器上安装无头 Chrome、wkhtmltopdf、Edge WebView2 或 PhantomJS。这正是客户从无头 Chrome 流水线迁移过来的主要原因 — 不会因 Chromium 更新而破坏渲染器,没有僵尸进程,也无需为 Windows Server 上基于 Chromium 的服务的授权问题担忧。
可以。将 URL 字符串作为源文件路径传入,转换器会抓取页面、渲染并一步生成目标格式:C.Convert("https://www.example.com/report", "c:\out\report.pdf", "-cPDF")。该功能广泛用于按计划将实时状态仪表盘、生成的报告或合作伙伴门户页面渲染为 PDF。
Total HTML Converter X 提供 COM/ActiveX 接口,因此任何支持 COM 的语言都可以直接调用:PHP 中使用 new COM("HTMLConverter.HTMLConverterX"),.NET 中使用 new HTMLConverterX(),Python 中使用 win32com.client.Dispatch("HTMLConverter.HTMLConverterX"),Ruby 中使用 WIN32OLE.new('HTMLConverter.HTMLConverterX')。或者,HTMLConverterX.exe 命令行二进制文件可以从任何进程、调度程序或 shell 脚本调用。还提供通过 ConvertToStream 直接进行 PDF 流式传输,适用于 ASP/PHP Web 响应。
Total HTML Converter 是用于工作站交互式使用的桌面 GUI 版本。Total HTML Converter X 是服务器 SDK:无图形界面、无对话框、无终端用户交互。它的授权适用于无人值守的服务器端使用,包括用于应用程序集成的 ActiveX/COM 接口,并支持免版税许可证以便在您自己的产品中重新分发。
可以。由于转换器是带有 COM 接口的常规 Windows 二进制文件,因此它可以在任何运行 Windows 的环境中工作:IIS 应用程序池、Windows 容器、Windows 运行时上的 Azure App Service 或 Azure Functions、AWS EC2 Windows 实例以及本地 Windows Server。注意:ActiveX 组件仅为 32 位,因此通过 COM 调用时请将 IIS 应用程序池或 .NET 运行时配置为 32 位。命令行二进制文件在 64 位 Windows 上没有任何限制。
可以。使用 -PFXFile "C:\certs\cert.pfx" -PFXPass "cert-pwd" 通过 X.509 证书对输出 PDF 进行数字签名。-HeadText-FootText 添加自定义页眉/页脚,并支持模板令牌如 [page][date][time] — 等同于 IE 的打印页眉。还支持水印(文本或图像)、AES-256 加密以及按权限标志(-perm Print|Copy|Modify)。
默认情况下,转换器会自动将 HTML 宽度适配到所选 PDF 页面尺寸 — 这是渲染宽幅报表表格到 PDF 时的常见需求。通过 CSS(page-break-beforepage-break-afterpage-break-inside: avoid)控制的分页符也会被遵循,因此行或节等逻辑单元在跨页时保持完整。-PageSize 为每个任务设置目标纸张大小(A4、Letter、Legal 等)。
是。下载即为功能完整的 30 天试用版,所有输出格式、ActiveX 和命令行功能都已解锁 — 无需信用卡,无需电子邮件即可开始使用。30 天后您可自行决定是否购买。许可证为一次性付款,享受终身更新和技术支持。
可以。将 .md 作为输出格式,转换器就会输出 GitHub-Flavored Markdown:HTML 标题映射到 #/##/###,表格变成 GFM 表格,列表保留为列表,锚点保留为 [text](url),代码块保留为围栏代码块。样板内容(导航、页脚、Cookie 横幅)会被剥离 — 只有文章正文进入索引。YAML frontmatter 块承载 source_urltitlecanonical、检测到的 languagegenerator,以及用于溯源的 binary hash。这是 CoolUtils RAG Adapter 的一部分 — 每款 Total Converter X 产品共享同一套 Markdown 约定。
它是与 Markdown 一并交付的可选旁路文件,遵循 IBM 主导的 RAG 工具使用的 Docling schema。对于 HTML 页面,它会记录:表格边界矩形、链接清单(内部/外部)、标题层级结构、每个章节的锚点、用于溯源的 binary_hash,以及您的分块器可读取的 chunks_hint 数组。在命令行中使用 -Docling 启用。JSON 与 Markdown 相互独立 — 您可以两者都送进索引,或者跳过它只使用 .md
可以 — 无需任何适配器。.md 文件是带 YAML frontmatter 块的纯 GFM,因此 LangChain 的 UnstructuredMarkdownLoader、LlamaIndex 的 MarkdownReader、Haystack 的 MarkdownToDocument 与 Claude Code 的 MCP 文件工具均可直接读取。对于 Claude、ChatGPT 或任意聊天 UI,您可以将 Markdown 原样粘贴进上下文 — 标题显示出某个分块来自哪一节,表格能渲染出来,frontmatter 给模型提供源 URL 与语言提示。
命令行:HTMLConverterX.exe "https://example.com/article" "C:\out\article.md" -cMD -Docling。对于离线页面,传入本地 HTML/MHT 文件代替 URL 即可。-cMD 选择 Markdown;-Docling 额外输出 .docling.json 旁路文件。COM 调用:obj.Convert("https://example.com", "page.md", "-cMD -Docling")。生成的 Markdown 可直接分块、嵌入并在任意向量存储中建立索引。

立刻开始工作!

下载试用版,只需几分钟即可转换文件。
无需信用卡或电子邮件。

⬇ 下载试用版 Windows 7/8/10/11 • 159 MB
Pro Suite

完整注册版的主要特点

  • 在网络服务器上将HTML转换为其他格式
  • 通过ActiveX接口为所有旧版编程语言(如Visual Basic 6或Delphi)以及脚本语言(如VBscript)提供访问。
  • 支持的语言包括任何支持Web服务的语言,如.NET(2.00, 3.5, 4.00)、Ruby、PHP和Java。
  • 无GUI或中断消息
  • 支持HTML、MHT、HTM、XHTML文件
  • 输出文件类型:DOC、PDF、XHTML、TXT、XLS、RTF、JPEG、TIFF、PNG、ODT、SVG、EMF。
  • 批量转换
  • 动态分页,带有页眉和页脚
  • 可指定来自URL或本地文件的HTML
  • 保留原始文档布局
  • 无需Adobe Acrobat或MS Word
  • 支持不同的字符集和编码表
  • 支持ActiveX多线程
  • 可从GUI设置生成命令行

    需要在您的应用中添加HTML转换功能吗?

    获取免版税许可证。它允许您将Total HTML ConverterX集成到您的软件中并重新分发。RFL以每个项目为许可单位(无论涉及多少开发人员)。
    通过联系表申请。


带有内置API支持的应用程序列表