Logo
Ana Sayfa Ürünler Destek İletişim Hakkımızda
arrow1 File Converters
arrow1 TIFF and PDF apps
arrow1 Forensic
arrow1 Freeware

PDF'yi Çevrimiçi XML'e Dönüştür


Ücretsiz Çevrimiçi PDF'den XML'e Dönüştürücü — PDF Verisini Tally ve Fatura XML'ine Ayıklayın

1) PDF dosyasını XML'ye dönüştürmek için yükleyin

 

Dosyaları buraya bırakın veya
seçmek için tıklayın
0 %

İzin verilen dosya türleri: pdf, ps, xps, pcl, pxl, prn, eps, djvu

2) PDF'den XML'ye dönüştürme ayarlarını yapın

Şuna Dönüştür

 

Ayarlar

3) Dönüştürülen dosyayı alın

DÖNÜŞTÜRÜLEN DOSYAYI İNDİRİN
Tam Sürüm
Dosyalarınızı güvenli bir şekilde toplu olarak dönüştürmek için Total PDF Converter edinin.

  PDF dosyalarını dönüştürmek için Total PDF Converter
  • PDF Dosyalarını Toplu Dönüştürün!;
  • PDF'den XML'ya ve birçok diğer formatta dönüştürücü
  • Üç tıklamada binlerce dosya dönüştürün;
  • İnternete ihtiyaç duymadan çalışan bir masaüstü dönüştürücüye sahip olun;
  • Dosyalarınızı internete göndermenize gerek yok;
  • Daha güçlü motorla daha doğru çıktı elde edin.
Özelliklere bakın
ŞİMDİ %20 İNDİRİMLİ - $65.00 $45.50
*Sadece bu ay. Bayiler için geçerli değildir.
kapat Total PDF Converter
okTotal PDF Converter, PDF, PS, EPS, PRN, XPS, OXPS dosyalarını destekler. Bu basit bir PRN dönüştürücü değil, hepsi bir arada bir çözümdür. Yeni formatlar sürekli olarak eklenmektedir.
okTotal PDF Converter'a kaynak dosyalardan resimleri çıkarmak isteyip istemediğinizi söyleyin. İsterseniz yalnızca resimlerle yeni bir dosya da elde edebilirsiniz.
okPDF'i toplu olarak PDF/A'ya dönüştürün. Binlerce dosyayı tek bir işlemde güncelleyin.
okTotal PDF Converter, çok sayfalı bir PDF'den seçilen sayfaları ayıklayarak bir PDF ayırma aracı olarak kullanılabilir. Aynı zamanda PDF'yi yer imleri ya da boş sayfalara göre de ayırabilir.
okTotal PDF Converter, dosyanın tarihini değiştirebilir veya orijinal zaman damgalarını koruyabilir. Sadece uygun kutucuğu işaretleyin.
okDosya dönüştürme işlemi sırasında PDF belgelerinizi dijital imzanızla imzalayın.
okGüçlü toplu PDF dönüştürücümüzle birden fazla PDF dosyasını tek bir çok sayfalı belge olarak birleştirin.
okTotal PDF Converter, belgelerinizi otomatik olarak döndürebilir.
okPDF'den Word'e dönüştürücü hem Doc hem de DOCX'i destekler.
okPDF'i JPG'ye dönüştürmek mi? Nihai resmi ihtiyaçlarınıza göre özelleştirin. JPEG görüntü kalitesini istediğiniz gibi ayarlayarak dosya boyutunu dengeleyin. Uygulama ayrıca seçilen sayfaları ayıklar ve JPEG'e dönüştürür.
okAçık arayüzümüz ile PDF/PS/EPS/PRN dosyalarını dönüştürün, başlangıç seviyesindekiler için birçok ipucu ile birlikte.
okEn geniş çıktı dosyası türleri listesi: DOC, DOCX, RTF, XLS, HTML, BMP, JPEG, GIF, WMF, EMF, PNG, EPS, PS, TIFF, TXT, CSV, PDF/A ve PDF!
okTotal PDF Converter, birkaç PDF dosyasını bir TIFF görüntüsünde birleştirebilir. Ya da çok sayfalı bir PDF'nin her sayfasını yeni TIFF dosyalarına yerleştirebilir.
okÇıktıyı ayarlayın: yazdırmaya hazır olacak şekilde standartlarınıza göre yeni kenar boşlukları ayarlayın.
okHer PDF dosyası Önizleme panelinde görüntülenir. Göz atabilir veya belgeyi tam boyutta görüntüleyebilirsiniz. Önizleme seçeneği, gerekli PDF dosyasını bulmayı kolaylaştırır.
okÇıktı dosyasının üst veya alt kısmına metin veya resim filigranları ekleyin. Bates damgalama için de mükemmel!
okDaha fazla düzen mi istiyorsunuz? Sayfalandırma ekleyin (klasörlerin ardışık numaralandırması mevcuttur).
okTotal PDF Converter sizin için tek veya çift sayfaları ayıklayabilir.
okÜcretsiz PDF dönüştürücülerden farklı olarak, uygulamamız klasör yapısını koruyarak binlerce belgeyi işler.
okHangi MS Office sürümüne sahip olduğunuz önemli değil, uygulamamız PDF'yi DOC ve DocX'e dönüştürebilir.
okAyrıca, Web\SQL sunucusu\ASP\.NET\C# için PDF Converter SDK sunuyoruz. ActiveX ile PDF dönüştürücümüzü uygulamanıza kolaylıkla entegre edebilir ve son kullanıcılar için dağıtabilirsiniz.
okTotal PDF Converter, tam komut satırı desteğine sahiptir (GUI'den kullanıma hazır komut satırını alın).

PDF dosyasını XML formatına nasıl dönüştürülür?

1

💾 Dosyanızı Yükleyin: Siteye gidin, «Dosya Yükle»ye tıklayın ve PDF dosyanızı seçin.

2

✍️ Dönüştürme Seçeneklerini Ayarlayın: Choose XML as the output format and adjust any additional options if needed.

3

Dönüştür ve İndir: XML dosyanızı indirmek için «Dönüştürülmüş Dosyayı İndir»e tıklayın.


Çevrimiçi PDF'tan XML'e Dönüştürme Aracı

Cloud Icon
Bulut Tabanlı
CoolUtils ile PDF'i XML'e çevirme ve dönüştürmek için herhangi bir yazılım yüklemenize gerek yoktur. İnternete bağlanın ve hizmetimizi kullanarak dosyalarınızı kolayca çevrimiçi olarak dönüştürebilirsiniz.
Cloud Icon
Güvenli
Donanımımız, gelişmiş elektronik gözetim ve çok faktörlü erişim kontrol sistemleri ile donatılmış, üst düzey, son derece güvenli veri merkezlerinde çalışmaktadır.
Cloud Icon
Kullanım Kolaylığı
PDF'lerden yapılandırılmış veriyi çevrimiçi XML'e ayıklamak hiç bu kadar kolay olmamıştı. .pdf dosyanızı bırakın; dönüştürücü belge düzenini ayrıştırsın ve her metin bloğu, tablo hücresi ve form alanı için öğeler içeren iyi biçimlendirilmiş XML çıktısı üretsin — Tally içe aktarma betikleri, SAP / Oracle veri ardışık düzenleri, fatura işleme ve hukuki belge iş akışları için hazır.
Cloud Icon
Gizlilik
Gizliliğin önemini anlıyoruz, bu nedenle dosyalarınızı ve kişisel bilgilerinizi nasıl işlediğimizi detaylandıran kapsamlı bir gizlilik politikası geliştirdik. Politikayı okuyabilirsiniz burada.

 

PDF'den XML'e Dönüştürücü — Sıkça Sorulan Sorular ▼

CoolUtils dönüştürücüye .pdf dosyanızı yükleyin ve İndir'e tıklayın. Dönüştürücü, PDF'nin içerik akışlarını — metin blokları, tablo hücreleri ve form alanı değerleri — ayrıştırır ve iyi biçimlendirilmiş XML belgesi çıktısı verir. Her sayfa bir <page> öğesine sarılır; metin blokları, tablo satırları ve form alanları sınırlayıcı kutu koordinatlarıyla alt öğe olur. 50 MB'a kadar dosyalar, kayıt gerekmez.
Çıktı, iyi biçimlendirilmiş XML'dir. Sayfalar, sayfa numarası özniteliğiyle <page> öğelerine sarılır. Metin blokları, konum için x, y, genişlik ve yükseklik öznitelikleriyle <text> öğesi olur. Tablo yapıları (net ızgara çizgilerine veya etiketli yapıya sahip PDF'lerden) <table>, <row> ve <cell> öğeleri üretir. Form alanı değerleri adlandırılmış öğeler olarak çıkarılır. Çıktı, XPath sorguları, XSLT dönüşümü veya herhangi bir XML farkında uygulamaya içe aktarma için hazırdır.
Ham XML çıktısı belge yapısını yakalar, ancak ERP sistemlerine içe aktarmadan önce dönüştürme gerektirir. Tipik iş akışı şöyledir: PDF'den XML çıkarma → hedef şemaya alan konumlarını eşlemek için XSLT stil sayfası → Tally XML fişi / SAP IDOC / Oracle XML içe aktarma. Bu dönüştürücünün işlediği çıkarma adımıdır — PDF'den yapılandırılmış veri elde etme.
Evet. Dönüştürücü yalnızca sayfa görüntüleri içeren taranmış PDF'yi (gömülü metin katmanı yok) algıladığında OCR otomatik olarak çalışır. Tanınan metin, algılanan konumlarda XML yapısına yerleştirilir. Doğruluk tarama kalitesine bağlıdır: 300 DPI veya üzeri, temiz basılmış metin en iyi sonuçları verir. El yazısı içerik ve düşük çözünürlüklü taramalar daha az doğru XML üretir.
Word, Excel veya LibreOffice'ten dışa aktarılan PDF'ler, hücre sınırları PDF yapısında kodlandığından en temiz tablo XML'ini üretir. Etiketli PDF'ler (PDF/UA, erişilebilirlik uyumlu belgeler) de mükemmeldir. Muhasebe yazılımı tarafından oluşturulan PDF'ler (SAP, Oracle) genellikle iyi çıkarılır. Metnin elle konumlandırıldığı masaüstü yayıncılık PDF'leri (InDesign, Quark) değişken doğrulukla çıkarılır.
Masaüstü yayıncılık yazılımı (InDesign, Quark) veya tablo yapısını kodlamayan uygulamalardan yazdırma yolu çıktısı kullanan PDF'ler, tek tek konumlandırılmış metin öğeleri kullanır. PDF, hangi metin parçalarının satır veya sütun oluşturduğuna dair hiçbir bilgi içermez — bunlar yalnızca koordinatlardaki kayan metinlerdir. Bu PDF'ler için tablo yapısını konum verilerinden yeniden oluşturmak üzere XSLT veya ayrıştırma betiğiyle son işleme gereklidir.
Çevrimiçi dönüştürücü 50 MB'a kadar dosyaları destekler. Büyük XBRL dosyaları, yüzlerce sayfalık PDF'ler veya binlerce PDF faturasından toplu çıkarma için masaüstü Total PDF Converter'ı kullanın. Dosya boyutu sınırı yoktur, aynı dönüştürme adımında XSLT son işlemesini destekler ve otomatik belge işleme hatları için komut satırından çalışır.
PDF'den XML'ye Puanlama   5 star PDF to XML   4.9 (2196 oylar)
Derecelendir
 

 

PDF'den XML'e Dönüştürme Nedir?

PDF'yi XML'e dönüştürmek, belgenin içeriğini — metin, tablolar, form alanları — ayrıştırmak ve yapılandırılmış, makine tarafından okunabilir bir XML dosyası çıktısı almak anlamına gelir. PDF'den metin kopyalamak ve yapıştırmaktan farklı olarak XML, belge yapısını korur: hangi metnin hangi paragrafa ait olduğu, hangi hücrelerin hangi tablo satırına ait olduğu, hangi değerlerin hangi form alanına ait olduğu. Bu, çıktıyı yalnızca okumak için değil, otomatik veri işleme için kullanışlı kılar.

PDF'yi Çevrimiçi XML'e Nasıl Dönüştürülür

  1. PDF'nizi yükleyin. Sürükleyip bırakın veya tıklayarak dosyaya gidin. 50 MB'a kadar dosyalar kabul edilir.
  2. İşlenmesini bekleyin. Dönüştürücü, PDF'nin iç içerik akışlarını ayrıştırır, metin bloklarını ve tablo yapılarını tanımlar ve XML belgesini oluşturur.
  3. XML'i indirin. .xml dosyasını kaydetmek için İndir'e tıklayın. Bir metin editöründe, XML editöründe açın veya doğrudan içe aktarma betiğinize iletin.

Kayıt, e-posta veya yazılım kurulumu gerekmez.

XML Çıktısının İçerdiği Bilgiler

Çıktı, iyi biçimlendirilmiş XML'dir. Yapı her sayfayı bir <page> öğesine sarar, alt öğeler metin blokları, tablo satırları, tablo hücreleri ve form alanları içindir. Öznitelikler, aşağı akış ayrıştırıcılarının tablo sütun ilişkilerini yeniden oluşturabilmesi veya öğeleri fiziksel konumlarıyla eşleştirebilmesi için sınırlayıcı kutu koordinatlarını (x, y, genişlik, yükseklik) taşır.

Kullanım Durumları: PDF'den XML'e Nerede Uygulanır

Kullanım DurumuAyrıntılar
Tally ERP içe aktarmaTallyPrime'ın HTTP ağ geçidi XML fişlerini kabul eder. Yaygın iş akışı: PDF fatura → XML → XSLT dönüşümü → Tally fiş XML → TallyPrime içe aktarma
SAP / Oracle veri hatlarıPDF formatlı satın alma siparişleri, faturalar veya teslimat notlarını yapılandırılmış XML'e ayrıştırın, ardından IDOC / BAPI entegrasyon katmanlarına iletin
Fatura işleme otomasyonuBorç hesapları otomasyonu için PDF faturalardan satıcı adı, fatura numarası, satır kalemleri ve toplamları çıkarma (RPA botları, Kofax, UiPath)
Hukuki belge analiziSözleşme yaşam döngüsü yönetimi (CLM) sistemleri için sözleşmeler ve mahkeme dosyalarından maddelerin, tarafların ve yükümlülüklerin yapılandırılmış çıkarılması
E-fatura ters ayrıştırmaFACTUR-X ve ZUGFeRD PDF'leri, PDF/A-3 kapsayıcısı içine gömülü bir XML yükü barındırır; normal PDF'ler için aşağı akış işlemesi amacıyla görünür veriyi XML'e çıkarın
Form verisi çıkarmaAcroForm ve XFA form alanı değerleri adlandırılmış XML öğeleri olarak çıkarılır — ölçekte standartlaştırılmış PDF formlarından yanıtları çekmek için kullanışlı

Taranmış PDF'ler ve OCR

PDF yalnızca sayfanın taranmış görüntülerini içeriyorsa (gömülü metin katmanı yok — eski belgeler, fakslar veya fotokopilerle yaygın), OCR, XML oluşturmadan önce metni tanımak için otomatik olarak çalışır. Doğruluk tarama kalitesine bağlıdır: 300 DPI, temiz kağıt ve basılmış (elle yazılmamış) metin en iyi sonuçları verir. OCR çıktısı, yerel metin PDF'leriyle aynı XML yapısını doldurur.

PDF'lerdeki Tablolar: Neler Temiz Çıkar, Neler Çıkmaz

PDF KaynağıTablo Çıkarma Kalitesi
Word / Excel / LibreOffice'ten dışa aktarıldıMükemmel — PDF yapısında kodlanmış hücre sınırları
Etiketli PDF (PDF/UA, erişilebilirlik uyumlu)Mükemmel — rol etiketleri tablo semantiğini korur
Muhasebe yazılımı tarafından oluşturulmuş PDF (SAP, Oracle)İyi — yapılandırılmış metin akışları görsel sütunlarla hizalanır
Taranmış ve OCR işlenmişOrta — sütun hizalaması OCR doğruluğuna ve sayfa kalitesine bağlıdır
Elle konumlandırılmış metin (masaüstü yayıncılık, InDesign)Değişken — metin blokları tablo ilişkisi meta verisi taşımayabilir

Çevrimiçi Dönüştürücü ve Total PDF Converter (Masaüstü)

ÖzellikÇevrimiçi DönüştürücüTotal PDF Converter (Masaüstü)
Dosya boyutu sınırı50 MBYok
Toplu dönüştürmeTek seferde bir dosyaBinlerce PDF, tüm klasörler
Komut satırı / betik oluşturmaHayırEvet — .bat, PowerShell, Görev Zamanlayıcı
API'li sunucu sürümüHayırTotalPDFConverterX — uygulama entegrasyonu için DLL / ActiveX
GizlilikHTTPS + otomatik silmeDosyalar makinenizi hiç terk etmez
ÜcretÜcretsiz$49,90 tek seferlik / 30 günlük ücretsiz deneme

Komut Satırıyla Toplu PDF'den XML'e Dönüştürme

Total PDF Converter ($49,90), toplu belge veri çıkarma hatları için komut satırından tüm PDF dosyası klasörlerini XML'e işler:

pdfconverter.exe /S "C:\Invoices\*.pdf" /F XML /O "C:\XML-Output"

Taranmış PDF'ler için optik karakter tanımayı etkinleştirmek üzere /OCR ekleyin. Elle veri girişi olmadan SAP, Oracle veya Tally'ye içe aktarmaya hazır XSLT dönüşümü ve içe aktarma için gelen PDF faturaları, satın alma siparişleri veya banka ekstrelerinden yapılandırılmış XML çıkarmak üzere borç hesapları otomasyon hattına veya belge işleme iş akışına entegre edin. 30 günlük ücretsiz deneme şu adreste mevcuttur: Total PDF Converter'ı İndir

 

 

PDF File

Dosya uzantısı .PDF
KategoriBelge dosyası
AçıklamaAdobe Systems Taşınabilir Belge Formatı (PDF) formatı, metin ve görüntüler de dahil olmak üzere basılı bir belgenin tüm içeriğini elektronik formda sunar, ayrıca bağlantılar, ölçekler, grafikler ve etkileşimli içerik gibi teknik ayrıntıları da içerir.

Bu dosyayı ücretsiz Acrobat Reader'da açabilir ve genellikle bir veya daha fazla sayfa olan sayfada veya tüm belgede gezinebilirsiniz. PDF formatı, önceden tasarlanmış dergiler, broşürler ve el ilanlarını kaydetmek için kullanılır.

İlişkili programlarAdobe Viewer
Ghostscript
Ghostview
Xpdf
CoolUtils PDF Viewer
GeliştirenAdobe Systems
MIME türüapplication/pdf
application/x-pdf
Faydalı bağlantılarPDF dosyaları hakkında daha ayrıntılı bilgi
Dönüştürme türüPDF 'den XML

XML File

Dosya uzantısı .XML
KategoriBelge dosyası
AçıklamaXML, HTML'ye benzeyen çok yönlü bir dil türüdür. Her ikisi de etiketlere dayandığı ve belgelerin içeriğini ve yapısını tanımladığı için birçok ortak noktaya sahip gibi görünseler de, birbirlerinin yerini alamazlar. Birincisi, HTML verileri gösterirken, XML verileri tanımlar. İkincisi, HTML standart etiketler kullanırken, XML hiçbir etiket kullanmaz ve XML belgeleri yazan kullanıcılar aslında bunları icat ederler. XML'ler, HTML'lere göre daha basit ve esnek görünmekte ve bilgiyi paylaşmak için çok tutarlı bir yol sunmaktadır. Bu arada, bu dosyalar bir yazılım parçası olmadan işlenemeyen statik veriler taşır.
İlişkili programlarChrome
Firefox
Microsoft Internet Explorer
Microsoft Office InfoPath
Notepad
Oxygen XML Editor
Safari
GeliştirenWorld Wide Web Consortium
MIME türüapplication/xml
text/xml
Faydalı bağlantılarXML dosyaları hakkında daha ayrıntılı bilgi

Şuna Dönüştür XML

CoolUtils kullanarak çeşitli formatları XML dosyalarına dönüştürmek mümkündür: