Logo
Strona główna Produkty Wsparcie Kontakt O nas
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware

Konwersja PDF do CSV z wiersza poleceń — wsadowy konwerter serwerowy

Masz foldery z raportami PDF, wyciągami bankowymi lub zgłoszeniami regulacyjnymi, a dane tabelaryczne wewnątrz nich muszą trafić do bazy danych, arkusza kalkulacyjnego lub potoku analitycznego. Kopiowanie i wklejanie tabel z czytnika PDF do Excela niszczy strukturę wierszy i kolumn już w pierwszych trzech stronach. Total PDF Converter X wyodrębnia tabele z plików PDF do CSV z wiersza poleceń, wsadowo, bez GUI. Zainstaluj go na serwerze Windows, wywołaj ze skryptu lub przez ActiveX i pozwól mu działać bez nadzoru.

Co potrafi Total PDF Converter X

  • Ekstrakcja wsadowa — podaj maskę (*.pdf), a konwerter przetworzy każdy pasujący plik w jednym przebiegu
  • Wyjście tabela-do-CSV — wykrywa wiersze i kolumny w PDF i zapisuje je jako rekordy z separatorami, gotowe do importu do Excela, Power BI, SQL lub pandas
  • Konfigurowalne separatory — przecinek, średnik, tabulator lub kreska pionowa przez -CSVDelimiter, aby pasować do systemu docelowego
  • Kontrola kodowania — UTF-8, UTF-16 lub ANSI przez -Encoding, aby czysto obsługiwać znaki spoza alfabetu łacińskiego
  • Obsługa cudzysłowów — otaczaj pola tekstowe za pomocą -CSVQuotation, aby chronić przecinki wewnątrz wartości komórek
  • Brak GUI — działa cicho z wiersza poleceń bez wyskakujących okien i dialogów potwierdzenia
  • ActiveX / COM — wywołuj konwerter z .NET, VBScript, PHP, Python lub dowolnego środowiska zgodnego z COM, aby osadzić ekstrakcję we własnej aplikacji
  • Skrypty .bat — zapisz polecenia w plikach wsadowych i zaplanuj je za pomocą Harmonogramu zadań systemu Windows do pełnej automatyzacji ekstrakcji

Konwersja PDF do CSV z wiersza poleceń

Pobierz wersję próbną

(30 dni, bez e-maila)

Kup licencję

(licencja serwerowa, wieczysta)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022

PDF a CSV: dlaczego warto konwertować?

PDF to format o stałym układzie zaprojektowany do wizualnej dystrybucji i druku. Tabela wewnątrz PDF nie jest strukturalnym obiektem danych — to seria fragmentów tekstu umieszczonych w określonych współrzędnych x/y na stronie. Czytnik renderuje je w sposób, który wygląda jak tabela, ale w samym pliku nie ma wierszy, kolumn ani komórek. Dlatego ręczne kopiowanie i wklejanie z PDF rzadko daje czyste wyjście tabelaryczne.

CSV to format danych zwykłego tekstu z jednym rekordem na linię i polami oddzielonymi separatorem. Importuje się bezpośrednio do Excela, Google Sheets, baz danych SQL, ramek danych pandas, R, Power BI, Tableau i każdego istniejącego narzędzia ETL. Gdy dane uwięzione w PDF muszą wejść do procesu analitycznego lub księgowego, najpierw muszą stać się CSV.

PDFCSV
CelWizualna dystrybucja, druk, archiwizacjaPozyskiwanie i analiza danych
StrukturaWspółrzędne strony, brak prawdziwych tabelWiersze i kolumny, natywnie
EdycjaTrudna, wymaga edytora PDFOtwiera się w dowolnym edytorze tekstu lub arkuszu
Ręczne kopiuj-wklejTraci strukturę tabeliZachowuje strukturę dokładnie
Proces pracyDokument na końcu potokuPoczątek potoku danych

Zastrzeżenie: automatyczna ekstrakcja PDF do CSV działa na PDF-ach tekstowych — tych wygenerowanych z systemów księgowych, silników raportów albo zapisanych jako PDF z arkusza kalkulacyjnego lub bazy danych. Skanowane PDF-y (obrazy papieru) nie zawierają warstwy tekstu i wymagają OCR jako oddzielnego kroku wstępnego, zanim jakakolwiek ekstrakcja CSV będzie możliwa.

Jak konwertować PDF do CSV z wiersza poleceń

Krok 1. Zainstaluj Total PDF Converter X

Pobierz instalator z linku powyżej i uruchom go na serwerze lub stacji roboczej Windows. Instalacja trwa mniej niż minutę. Konwerter parsuje warstwę tekstu PDF bezpośrednio — nie potrzebuje żadnego zewnętrznego czytnika PDF, Acrobata ani instalacji pakietu Office.

Krok 2. Otwórz wiersz poleceń

Otwórz cmd.exe lub PowerShell. Plik wykonywalny konwertera to PDFConverter.exe, znajdujący się w folderze instalacyjnym (zwykle C:\Program Files\CoolUtils\TotalPDFConverterX\). Dodaj go do systemowej zmiennej PATH lub używaj pełnej ścieżki w poleceniach.

Krok 3. Uruchom podstawową konwersję

Najprostsze polecenie wyodrębnia tabele ze wszystkich plików PDF w folderze do CSV:

PDFConverter.exe C:\Reports\*.pdf C:\Output\ -c CSV

Przetwarza każdy plik .pdf w folderze C:\Reports\ i zapisuje wynikowe pliki CSV w C:\Output\. Każdy PDF tworzy jeden CSV o tej samej nazwie bazowej. Wielostronicowe PDF-y są domyślnie łączone w jeden plik CSV na plik źródłowy.

Krok 4. Dodaj opcje separatora, kodowania i cudzysłowów

Kontroluj format CSV za pomocą dodatkowych flag:

PDFConverter.exe C:\Reports\*.pdf C:\Output\ -c CSV -CSVDelimiter ; -CSVQuotation " -Encoding UTF-8 -log C:\Logs\pdf2csv.log
  • -CSVDelimiter ; — separator pól (przecinek, średnik, tabulator, kreska pionowa)
  • -CSVQuotation " — otaczaj pola tekstowe podwójnymi cudzysłowami, aby chronić przecinki wewnątrz komórek
  • -Encoding UTF-8 — kodowanie wyjścia (UTF-8, UTF-16, ANSI) dla poprawnej obsługi znaków spoza alfabetu łacińskiego
  • -log C:\Logs\pdf2csv.log — zapisz dziennik konwersji do weryfikacji

Krok 5. Zautomatyzuj za pomocą pliku .bat

Zapisz polecenie w pliku .bat i zaplanuj je za pomocą Harmonogramu zadań systemu Windows:

@echo off
"C:\Program Files\CoolUtils\TotalPDFConverterX\PDFConverter.exe" C:\Incoming\*.pdf C:\Archive\CSV\ -c CSV -CSVDelimiter ; -Encoding UTF-8 -log C:\Logs\pdf2csv.log

Uruchamia ekstrakcję każdej nocy (lub z dowolną częstotliwością) i zapisuje plik dziennika, aby można było zweryfikować wyniki. Połącz to z następnym krokiem importującym pliki CSV do bazy danych lub hurtowni analitycznej.

Integracja ActiveX / COM

Total PDF Converter X zawiera pełny interfejs ActiveX. Możesz wywoływać konwerter z dowolnego środowiska zgodnego z COM — .NET, VBScript, PHP, Python, Ruby lub ASP. Pozwala to osadzić ekstrakcję PDF do CSV we własnej aplikacji webowej, portalu intranetowym lub procesie dokumentowym bez uruchamiania osobnego procesu z wiersza poleceń.

Przykład (C#/.NET):

PDFConverterX Cnv = new PDFConverterX();
Cnv.Convert("C:\\Reports\\statement.pdf", "C:\\Output\\statement.csv", "-c CSV -CSVDelimiter ; -Encoding UTF-8 -log c:\\Logs\\pdf.log");

Przykład (PHP):

$c = new COM("PDFConverter.PDFConverterX");
$c->convert("C:\\Reports\\statement.pdf", "C:\\Output\\statement.csv", "-c CSV -CSVDelimiter ; -Encoding UTF-8 -log c:\\Logs\\pdf.log");

To samo wywołanie działa z ASP.NET, VBScript, Python, Ruby, Perl i JavaScript (Windows Script Host). Twoja aplikacja webowa może przyjmować przesyłane pliki PDF i zwracać użytkownikowi gotowe do importu dane CSV w czasie rzeczywistym.

Konwertery online a Total PDF Converter X

FunkcjaKonwertery onlineTotal PDF Converter X
Przetwarzanie wsadoweJeden plik narazNieograniczona liczba plików na partię
Prywatność plikówPliki wysyłane na serwer zewnętrznyPliki nigdy nie opuszczają Twojego komputera
Dane poufneRyzykowne — wyciągi bankowe, płace, zgłoszeniaBezpieczne — przetwarzanie lokalne
Limity rozmiaru plikuTypowy limit 5–25 MBBrak narzuconego limitu
Kontrola separatoraStały przecinek, bez wyboruPrzecinek, średnik, tabulator, kreska pionowa
Kontrola kodowaniaCzęsto tylko ANSI, łamie UnicodeUTF-8, UTF-16, ANSI do wyboru
AutomatyzacjaTylko ręcznieWiersz poleceń, .bat, Harmonogram zadań, ActiveX
Wdrożenie na serwerzeNiemożliweZaprojektowany dla serwerów, bez GUI
Wymaga internetuTakNie

Kiedy potrzebna jest konwersja PDF do CSV z wiersza poleceń

  • Uzgadnianie wyciągów bankowych. Księgowość otrzymuje wyciągi PDF z dziesiątek rachunków bankowych. Nocna partia wyodrębnia każdy wyciąg do CSV, a kolejny krok potoku importuje wiersze do księgi głównej do dopasowywania.
  • Zgłoszenia regulacyjne i raporty finansowe. Kwartalne 10-Q, roczne 10-K i raporty ESG przychodzą jako PDF-y. Analitycy giełdowi pobierają dane tabelaryczne do modelu w arkuszu. Automatyczna ekstrakcja wygrywa z ręcznym przepisywaniem zarówno pod względem szybkości, jak i dokładności.
  • Pozycje faktur dla automatyzacji AP. Dostawcy wysyłają faktury jako PDF-y. Wyodrębnienie tabeli pozycji do CSV trafia bezpośrednio do dopasowywania w zobowiązaniach i wprowadzania do ERP, eliminując urzędników wprowadzających dane.
  • Dane naukowe i laboratoryjne. Oprogramowanie aparatury eksportuje wyniki jako PDF. Naukowcy potrzebują wartości bazowych do dalszej analizy w R, Pythonie lub MATLAB-ie. Wsadowa ekstrakcja CSV czyni dane przetwarzalnymi.
  • Audyt i dowody zgodności. Audytorzy otrzymują księgi PDF i próby testów merytorycznych. Wyodrębnienie ich do CSV pozwala na oznaczanie, próbkowanie i procedury analityczne wewnątrz Excela albo oprogramowania audytowego, takiego jak IDEA czy ACL.

Dlaczego Total PDF Converter X

Prawdziwe wykrywanie tabel

Konwerter parsuje warstwę tekstu PDF i rekonstruuje strukturę wiersz-i-kolumna na podstawie współrzędnych i wyrównania. Wielokolumnowe układy raportów, scalone nagłówki i tabele ciągnące się przez wiele stron są obsługiwane w jednym przebiegu — nie jako ciąg rozproszonych słów.

Prawdziwa aplikacja serwerowa

Total PDF Converter X jest zaprojektowany do pracy bez nadzoru. Żadnych okien GUI, okien dialogowych, monitów potwierdzenia ani zależności od Acrobata. Działa cicho z wiersza poleceń lub jako część usługi — dokładnie to, czego potrzebuje produkcyjny potok ekstrakcji.

Kodowanie, które faktycznie działa

Wyciągi bankowe z niemieckimi umlautami, polskimi znakami diakrytycznymi, cyrylickimi nazwami sprzedawców lub chińskimi kontrahentami pozostają czytelne w wyjściu CSV. -Encoding UTF-8 w wierszu poleceń i wynikowy plik czysto importuje się do dowolnej nowoczesnej bazy danych albo narzędzia BI.

Nie tylko CSV

To samo narzędzie wiersza poleceń konwertuje PDF do DOC, XLS, HTML, TXT, TIFF, JPEG i wielu innych formatów. Jedna instalacja pokrywa każdy cel konwersji PDF, jakiego możesz potrzebować. Zmień -c CSV na -c XLS, a otrzymasz skoroszyt Excela z tymi samymi funkcjami wsadowymi i automatyzacji.

Pobierz wersję próbną

(30 dni, bez e-maila i karty kredytowej)

Kup licencję

(licencja serwerowa, wieczysta)

Windows 7/8/10/11 • Server 2008/2012/2016/2019/2022


quote

Konwerter plików PDF dla serwerów Opinie klientów 2026

Oceń
Ocenione na 4.7/5 na podstawie opinii klientów
5 Star

"Kwartalne wyniki przychodzą jako PDF-y, a my modelujemy je w Excelu. Total PDF Converter X działa z wiersza poleceń na całym folderze zgłoszeń 10-Q i produkuje czyste CSV w mniej niż minutę. Wielokolumnowe tabele i scalone nagłówki wychodzą poprawnie ustrukturyzowane, co było wykluczającym warunkiem przy dwóch wcześniejszych narzędziach, które próbowaliśmy. Separator średnika i flaga UTF-8 oznaczają, że europejscy emitenci już nie psują naszego importu."

5 Star Caroline Whitfield Senior Financial Analyst, Mid-Market Equity Research

"Pozyskujemy setki wyciągów bankowych dziennie do uzgadniania. Skrypt .bat owijający PDFConverter.exe upuszcza pliki CSV do gorącego folderu, a nasz potok ETL je odbiera. Zerowa obecność GUI na serwerze, żadnej licencji Acrobata, a plik dziennika daje nam ścieżkę audytu. Konfiguracja zajęła około godziny, w tym testy ActiveX z naszego wewnętrznego narzędzia C#."

5 Star Rohan Mehta Data Engineer, Banking Operations

"Zlecenia w terenie często wręczają nam księgi główne PDF z systemów klientów. Konwertowanie tego do CSV oznaczało żmudne kopiuj-wklej albo płacenie za importy IDEA. Teraz uruchamiamy konwerter na kopii zainstalowanej na USB i ładujemy CSV bezpośrednio do naszych analitycznych dokumentów roboczych. Skanowane PDF-y wciąż wymagają OCR po stronie wcześniejszej, ale dla natywnych PDF-ów wykrywanie tabel jest niezawodne. Dokumentacja mogłaby być bardziej szczegółowa, ale wsparcie odpowiedziało w ciągu dnia."

4 Star Anika Larsen Audit Specialist, Big Four Practice

Najczęściej zadawane pytania ▼

Podstawowe polecenie to: PDFConverter.exe C:\Reports\*.pdf C:\Output\ -c CSV. Wyodrębnia to tabele z każdego PDF w folderze źródłowym i zapisuje je jako pliki CSV. Dodaj flagi takie jak -CSVDelimiter ;, -Encoding UTF-8 lub -log, aby kontrolować wyjście.
Nie. Skanowane PDF-y to obrazy papieru i nie zawierają warstwy tekstu. Konwerter czyta warstwę tekstu natywnych (tekstowych) PDF-ów — wyciągów, raportów i dokumentów generowanych przez oprogramowanie. Pliki skanowane wymagają OCR jako oddzielnego kroku wstępnego, zanim jakakolwiek strukturalna ekstrakcja CSV będzie możliwa.
Analizuje współrzędne i wyrównanie fragmentów tekstu na każdej stronie PDF. Słowa, które dzielą tę samą linię bazową, tworzą wiersz, a słowa wyrównane pionowo tworzą kolumnę. Działa to na standardowych układach tabelarycznych, w tym wielokolumnowych raportach, scalonych nagłówkach i tabelach ciągnących się przez wiele stron.
Tak. Użyj -CSVDelimiter, po którym następuje znak. -CSVDelimiter ; dla średnika (popularne w lokalizacjach europejskich, gdzie przecinek jest separatorem dziesiętnym), -CSVDelimiter \t dla tabulatora albo -CSVDelimiter | dla kreski pionowej. Domyślnie jest przecinek.
Dodaj -Encoding UTF-8 do wiersza poleceń. Produkuje to pliki CSV w kodowaniu UTF-8, które zachowują niemieckie umlauty, polskie znaki diakrytyczne, cyrylicę, chiński, japoński i wszelkie inne znaki Unicode obecne w PDF. Obsługiwane są również UTF-16 i ANSI.
Użyj -CSVQuotation ", aby otoczyć pola tekstowe podwójnymi cudzysłowami. Konwerter eskejpuje osadzone cudzysłowy zgodnie z RFC 4180, dzięki czemu wartości takie jak "Smith, John" przeżywają podróż w obie strony do Excela, pandas albo dowolnego standardowego parsera CSV bez łamania liczby kolumn.
Tak. Total PDF Converter X rejestruje się jako obiekt COM/ActiveX (PDFConverter.PDFConverterX). Możesz wywoływać go z .NET, PHP, Python, VBScript, ASP, Ruby, Perl i dowolnego innego środowiska zgodnego z COM, aby osadzić ekstrakcję PDF do CSV bezpośrednio w aplikacji.

Przykłady Total PDF Converter X

Konwertuj pliki PDF za pomocą Total PDF Converter X i .NET


string src  = @"C:\test\Source.pdf";
string dest = @"C:\test\Dest.docx";

var cnv = new PDFConverterX();
cnv.Convert(src, dest, "-cDOC -log c:\\test\\PDF.log");

if (!string.IsNullOrEmpty(cnv.ErrorMessage))
    throw new Exception(cnv.ErrorMessage);

Konwertuj pliki PDF na serwerach WWW za pomocą Total PDF Converter X

public static class Function1
    {
        [FunctionName("Function1")]
        public static async Task Run(
            [HttpTrigger(AuthorizationLevel.Anonymous, "get", "post", Route = null)] HttpRequest req,
            ILogger log)
        {
            StringBuilder sbLogs = new StringBuilder();
            sbLogs.AppendLine("started...");
            try
            {
                ProcessStartInfo startInfo = new ProcessStartInfo();
                startInfo.CreateNoWindow = true;
                startInfo.UseShellExecute = false;
                var assemblyDirectoryPath = Path.GetDirectoryName(Assembly.GetExecutingAssembly().Location);
                assemblyDirectoryPath = assemblyDirectoryPath.Substring(0, assemblyDirectoryPath.Length - 4);

                var executablePath = $@"{assemblyDirectoryPath}\Converter\PDFConverterX.exe";
                sbLogs.AppendLine(executablePath + "...");
                var srcPath = $@"{assemblyDirectoryPath}\src\sample.pdf";
                var outPath = Path.GetTempFileName() + ".docx";
                startInfo.FileName = executablePath;

                if (File.Exists(outPath))
                {
                    File.Delete(outPath);
                }

                if (File.Exists(executablePath) && File.Exists(srcPath))
                {
                    sbLogs.AppendLine("files exists...");
                }
                else
                    sbLogs.AppendLine("EXE & source files NOT exists...");
                startInfo.WindowStyle = ProcessWindowStyle.Hidden;
                startInfo.Arguments = $"\"{srcPath}\" \"{outPath}\" -cDOC";
                using (Process exeProcess = Process.Start(startInfo))
                {
                    sbLogs.AppendLine($"wait...{DateTime.Now.ToString()}");
                    exeProcess.WaitForExit();
                    sbLogs.AppendLine($"complete...{DateTime.Now.ToString()}");
                }
                sbLogs.AppendLine("Conversion complete.");
            }
            catch (Exception ex)
            {
                sbLogs.AppendLine(ex.ToString());
            }

            return new OkObjectResult(sbLogs);
        }
    }
Więcej informacji o Azure Functions.

Konwertuj pliki PDF na serwerach WWW za pomocą Total PDF Converter X

dim C
Set C=CreateObject("PDFConverter.PDFConverterX")
C.Convert "c:\test\source.pdf", "c:\test\dest.docx", "-cDOC -log c:\test\PDF.log"
Response.Write C.ErrorMessage
set C = nothing

Strumieniuj wynikowy dokument bezpośrednio z ASP

dim C
Set C=CreateObject("PDFConverter.PDFConverterX")
Response.Clear
Response.AddHeader "Content-Type", "binary/octet-stream"
Response.AddHeader "Content-Disposition", "attachment; filename=test.docx"
Response.BinaryWrite C.ConvertToStream("C:\www\ASP\Source.pdf", "C:\www\ASP", "-cDOC -log c:\html.log")
set C = nothing

Konwertuj pliki PDF za pomocą PHP i Total PDF Converter X

$src="C:\\test\\test.pdf";
$dest="C:\\test\\test.docx";
if (file_exists($dest)) unlink($dest);
$c= new COM("PDFConverter.PDFConverterX");
$c->convert($src,$dest, "-cDOC -log c:\\test\\PDF.log");
if (file_exists($dest)) echo "OK"; else echo "fail:".$c->ErrorMessage;

Konwertuj pliki PDF za pomocą Total PDF Converter X i Ruby

require 'win32ole'
c = WIN32OLE.new('PDFConverter.PDFConverterX')

src = "C:\\test\\test.pdf"
dest = "C:\\test\\test.docx"

c.convert(src, dest, "-cDOC -log c:\\test\\PDF.log")

if not File.exist?(dest)
  puts c.ErrorMessage
end

Konwertuj pliki PDF za pomocą Total PDF Converter X i Pythona

import win32com.client
import os.path

c = win32com.client.Dispatch("PDFConverter.PDFConverterX")

src  = "C:\\test\\test.pdf"
dest = "C:\\test\\test.docx"

c.convert(src, dest, "-cDOC -log c:\\test\\PDF.log")

if not os.path.exists(dest):
    print(c.ErrorMessage)

Konwertuj pliki PDF za pomocą Pascala i Total PDF Converter X

uses Dialogs, Vcl.OleAuto;

var
  c: OleVariant;
begin
  c := CreateOleObject('PDFConverter.PDFConverterX');
  c.Convert('c:\test\source.pdf', 'c:\test\dest.docx', '-cDOC -log c:\test\PDF.log');
  if c.ErrorMessage <> '' then
    ShowMessage(c.ErrorMessage);
end;

Konwertuj pliki PDF na serwerach WWW za pomocą Total PDF Converter X

var c = new ActiveXObject("PDFConverter.PDFConverterX");
c.Convert("C:\\test\\source.pdf", "C:\\test\\dest.docx", "-cDOC");
if (c.ErrorMessage != "")
  alert(c.ErrorMessage)

Konwertuj pliki PDF za pomocą Total PDF Converter X i Perla

use Win32::OLE;

my $src  = "C:\\test\\test.pdf";
my $dest = "C:\\test\\test.docx";

my $c = CreateObject Win32::OLE 'PDFConverter.PDFConverterX';
$c->convert($src, $dest, "-cDOC -log c:\\test\\PDF.log");
print $c->ErrorMessage if -e $dest;

 

Zacznij pracować teraz!

Pobierz wersję próbną i konwertuj pliki w kilka minut.
Nie jest wymagana karta kredytowa ani e-mail.

⬇ Pobierz wersję próbną Windows 7/8/10/11 • 136 MB

Support
Konwerter plików PDF dla serwerów Preview1

Najnowsze wiadomości

Subskrybuj newsletter

Bez obaw, nie wysyłamy spamu.


© 2026. Wszelkie prawa zastrzeżone. CoolUtils File Converters

Cards