複数ページのTIFFファイル — FAX、スキャンされた書籍、ドキュメントアーカイブ — のフォルダがあり、シングルページ入力を期待する下流システムがある場合。各TIFFを画像ビューアで開いてページを1つずつエクスポートする方法は、2、3ファイルを超えるとスケールしません。TIFF Paging Xは、GUIなし、画像エディターのインストールも不要で、コマンドラインから複数ページのTIFFをシングルページのTIFFにバッチ分割します。Windowsサーバーにインストールし、スクリプトやActiveX経由で呼び出して、無人で実行できます。
*.tif)を指定するだけで、すべての複数ページTIFFを一回の実行で処理-Pages 1-5,10-15)を抽出{name}_p{page:000}のようなパターンで出力名を制御し、scan_p001.tif、scan_p002.tifなどを生成
(30日間、メール登録不要)
(サーバーライセンス、永続版)
Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022
複数ページTIFFは、ドキュメントのすべてのページを1つのファイルに詰め込みます。FAX、スキャンされた書籍、アーカイブされた通信物は、関連するページを一緒に保つためにこの形式で届くことがよくあります。トレードオフは、200ページのTIFFの47ページ目を開くと、適切なオフセットに到達するためにスタック全体をデコードする必要がある点です。ファイル単位でインデックスする保存ツールは個別のページに到達できません。分散処理パイプラインは、すべてのワーカーでファイル全体をデシリアライズする必要があります。
シングルページTIFFは、1ファイルに1ページを格納します。各ページはファイル名でアドレス指定可能になります。ドキュメント管理システムは、特定のページにメタデータ、ベイツ番号、OCRテキストを添付できます。ワーカープロセスはロック競合なしで並列にファイルをピックアップできます。失敗した変換はバッチ全体ではなく1ページに影響します。複数ページTIFFがそのワークフローに入る必要がある場合、まず分割する必要があります。
| 複数ページTIFF | シングルページTIFF | |
|---|---|---|
| ランダムアクセス | ページに到達するためにファイル全体をデコード | 名前で直接ファイルを開く |
| ページごとのワークフロー | 困難 — ページオフセットでインデックス | 容易 — ファイル名でインデックス |
| ファイルごとのサイズ | 大(全ページの合計) | 小(1ファイル1ページ) |
| 並列処理 | 1つのファイルでロック競合 | ワーカーごとに1ファイル、競合なし |
| OCRパイプライン | 事前分割が必要 | ページを直接供給 |
上のリンクからインストーラーをダウンロードし、Windowsサーバーまたはワークステーションで実行します。セットアップは1分以内で完了します。画像エディター、Photoshop、イメージングSDKは不要です — 分割ツールはCCITT G4、LZW、JPEG-in-TIFF、ZIP、非圧縮ページを処理する独自のTIFFパーサーを使用します。
cmd.exeまたはPowerShellを開きます。分割ツールの実行ファイルはTIFFPaging.exeで、インストールフォルダ(通常はC:\Program Files\CoolUtils\TiffPagingX\)にあります。システムPATHに追加するか、コマンドでフルパスを使用してください。
最もシンプルなコマンドは、フォルダ内のすべての複数ページTIFFを分割します:
TIFFPaging.exe C:\Scans\*.tif C:\Output\ -Split
このコマンドはC:\Scans\内の各.tifファイルを処理し、ソースのページごとに1つのシングルページTIFFをC:\Output\に書き出します。50ページのinvoice.tifはinvoice_001.tifからinvoice_050.tifになります。入力フォルダ内のシングルページTIFFは自動的にスキップされます。
追加のフラグで出力を制御します:
TIFFPaging.exe C:\Scans\*.tif C:\Output\ -Split -NamePattern "{name}_p{page:000}" -Pages 1-5,10-15 -log C:\Logs\split.log
-NamePattern "{name}_p{page:000}" — 出力名をフォーマット。{name}はソースのベース名、{page:000}はゼロパディングされたページ番号-Pages 1-5,10-15 — 1~5ページと10~15ページのみを抽出。すべてのページを分割するには省略-Compression Source — ソースの圧縮を保持(デフォルト)。再圧縮するにはCCITTG4、LZW、またはNoneを使用-log C:\Logs\split.log — 検証用にファイルごとのログを出力コマンドを.batファイルに保存し、Windowsタスクスケジューラでスケジュールします:
@echo off
"C:\Program Files\CoolUtils\TiffPagingX\TIFFPaging.exe" C:\Incoming\*.tif C:\Archive\Pages\ -Split -NamePattern "{name}_p{page:000}" -log C:\Logs\split.log
これにより、毎晩(または設定した任意の間隔で)分割が実行され、結果を検証できるログファイルが出力されます。処理済みのソースファイルをアーカイブフォルダに移動するクリーンアップステップと組み合わせてください。
TIFF Paging Xには完全なActiveXインターフェースが含まれています。.NET、VBScript、PHP、Python、Ruby、ASPなど、あらゆるCOM互換環境から分割ツールを呼び出せます。これにより、コマンドラインプロセスを外部起動することなく、独自のドキュメント管理アプリケーション、インテークポータル、またはイメージングワークフローにTIFF分割を組み込めます。
例(C#/.NET):
TIFFPagingX Tpx = new TIFFPagingX();
Tpx.Convert("C:\\Scans\\book.tif", "C:\\Output\\", "-Split -NamePattern \"{name}_p{page:000}\" -log c:\\Logs\\split.log");
例(PHP):
$t = new COM("TIFFPaging.TIFFPagingX");
$t->convert("C:\\Scans\\book.tif", "C:\\Output\\", "-Split -NamePattern \"{name}_p{page:000}\" -log c:\\Logs\\split.log");
同じ呼び出しがASP.NET、VBScript、Python、Ruby、Perl、JavaScript(Windows Script Host)でも動作します。インテークアプリケーションはアップロードされた複数ページTIFFを受け取り、リアルタイムでシングルページファイルのディレクトリをユーザーに返すことができます。
| 機能 | オンライン分割ツール | TIFF Paging X |
|---|---|---|
| バッチ処理 | 一度に1ファイルのみ | バッチあたりファイル数無制限 |
| ファイルのプライバシー | サードパーティサーバーにアップロード | ファイルは自分のマシンから外に出ない |
| ファイルサイズ制限 | 典型的に50~100 MBの上限 | 制限なし — ギガバイトのTIFFをサポート |
| 圧縮の保持 | 多くの場合JPEGに再エンコード | ソースの圧縮を保持 |
| ページ範囲のサブセット | 稀 | 組み込みの-Pagesフラグ |
| 自動化 | 手動のみ | コマンドライン、.bat、タスクスケジューラ、ActiveX |
| サーバー展開 | 不可 | サーバー向け設計、GUI不要 |
| インターネット必要 | はい | いいえ |
分割ツールは、ソースと同じ圧縮でシングルページTIFFを書き出します。CCITT G4のFAXページはCCITT G4のままです。LZW圧縮されたスキャンはLZWのままです。JPEG-in-TIFFの写真はJPEGのままです。再エンコード、品質低下、予期せぬファイルサイズの増加はありません。エンコーディングを実際に変更する必要がある場合のみ-Compressionでオーバーライドしてください。
TIFF Paging Xは無人運用向けに設計されています。GUIウィンドウ、ダイアログボックス、確認プロンプトはありません。コマンドラインから、またはサービスの一部としてサイレントに実行されます — 本番インテークサーバーに必要なものそのものです。同じバイナリが5ページの請求書も3,000ページのアーカイブスキャンも処理します。
分割ツールは処理前に各入力ファイルを検査します。シングルページTIFFはスキップされ、コピーや名前変更はされません。これにより、複製を生成したり出力を汚染したりすることなく、シングルページと複数ページのTIFFが混在するフォルダを指定できます。ログには分割されたものとスキップされたものが記録されます。
反対の操作 — 多くのシングルページTIFFを1つの複数ページファイルに結合する — はTIFF Combine Xが処理します。両ツールはコマンドライン規約を共有しているため、インテーク時に分割し、アーカイブ保存のために再結合するワークフローは、両方向で1つの一貫した構文を使用します。
(30日間、メールやクレジットカード不要)
(サーバーライセンス、永続版)
Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022
"当社のスキャナーは200ページのバッチを単一の複数ページTIFFとして書き出しますが、患者記録システムはチャート固有のメタデータを持つ1ファイル1ページで保存します。TIFF Paging Xはインテークフォルダに対して15分ごとのタスクスケジューラジョブとして実行されます。CCITT G4圧縮が正確に保持される点が重要です。当社はソースページの再エンコードを禁止する保持ルールに縛られているからです。300ページを超えるTIFFで壊れていた古い社内ツールを置き換えました。"
Margarethe Voss Document Imaging Specialist, Regional Health Network
"当社は製本された巻物を複数ページTIFFとしてデジタル化し、IIIFタイルサーバー用にシングルページファイルが必要です。分割ツールは800ページの書籍を問題なく処理し、NamePatternフラグによりビューアバックエンドが期待するファイル名と一致させられます。ページ範囲サポートはページの再スキャンが必要な場合に便利です — 既存ファイル上で修正範囲を分割するだけです。GUIなしはバックエンドサーバーで望んでいたとおりでした。"
Daniel Okafor Archive Manager, University Special Collections
"プロダクションセットは複数ページTIFFで届き、当社のベイツスタンプツールがそれを扱う前に分割する必要があります。アップロード時に即座に分割が起こるよう、ActiveXインターフェースをインテークスクリプトに統合しました。COM呼び出しは簡単で、4コアのマシン上でリアルタイム応答に十分高速です。NamePatternトークンリストに関するドキュメントはもっと詳細にしてほしいですが、サポートは1日以内に質問に答えてくれました。"
Patricia Lindgren Litigation Support Lead
TIFFPaging.exe C:\Scans\*.tif C:\Output\ -Split です。ソースフォルダ内のすべての複数ページTIFFを処理し、ソースページごとに1つのシングルページTIFFを書き出します。-NamePattern、-Pages、-logなどのフラグを追加して出力を制御できます。-Pagesフラグをカンマ区切りのページ番号と範囲で使用します。例えば-Pages 1-5,10-15,20は、1~5ページ、10~15ページ、20ページのみを抽出します。範囲外のページはスキップされるため、出力フォルダには指定したページのみが含まれます。-NamePatternフラグは"{name}_p{page:000}"のようなテンプレートを受け付けます。{name}はソースのベース名、{page}はページ番号、{page:000}は3桁にゼロパディングします。50ページのinvoice.tifはinvoice_p001.tifからinvoice_p050.tifになります。-Compression CCITTG4、-Compression LZW、または-Compression Noneを渡してください。TIFFPaging.TIFFPagingX)として登録されます。.NET、PHP、Python、VBScript、ASP、Ruby、Perl、その他のCOM互換環境から呼び出せます。コマンドラインで使用するのと同じパラメータ構文がCOMのConvertメソッドを通じて動作します。.batファイルに保存し、Windowsタスクスケジューラに追加します。分割ツールはスケジュールされた時刻に無人で実行され、監視フォルダ内の新しい複数ページTIFFをすべて処理し、検証用のログファイルを出力します。処理済みのソースファイルをアーカイブフォルダに移動するクリーンアップステップと組み合わせてください。無料トライアルをダウンロードして、ファイルを数分で変換。
クレジットカードもメールアドレスも不要。