
Hi, hat sich von euch schon jemand Daten aus PDF tabellen extrahieren beschäftigt? Ich hätte gerne die Tabelle im Anhang von https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf als maschinenlesbare Daten. Vielen Dank im Voraus! Gruß Martin

Hallo Martin, hast Du es schon mit Tabula (https://tabula.technology/) probiert? Die großen Downloadbuttons auf der Homepage gibt es nur für Win & Mac, aber im Text findest Du auch Hinweise auf Linux. Viele Grüße Florian Brucker -- Stadt Karlsruhe Amt für Informationstechnik und Digitalisierung Open Government Zähringerstraße 61, 76133 Karlsruhe Tel: +49 721 133-1762 Bürozeiten: Montag + Dienstag ganztägig, Mittwoch nachmittags "Codeforkarlsruhe" <codeforkarlsruhe-bounces@mlists.okfn.de> schrieb am 24.09.2018 13:37:45:
Von: Martin Vietz <martin@entropia.de> An: codeforkarlsruhe@mlists.okfn.de, Datum: 24.09.2018 13:37 Betreff: [Codeforkarlsruhe] PDF parsen Gesendet von: "Codeforkarlsruhe" <codeforkarlsruhe-bounces@mlists.okfn.de>
Hi,
hat sich von euch schon jemand Daten aus PDF tabellen extrahieren beschäftigt? Ich hätte gerne die Tabelle im Anhang von https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf als maschinenlesbare Daten.
Vielen Dank im Voraus!
Gruß Martin
-- Codeforkarlsruhe mailing list Codeforkarlsruhe@mlists.okfn.de https://mlists.okfn.de/cgi-bin/mailman/listinfo/codeforkarlsruhe

Hi, On 24.09.2018 13:37, Martin Vietz wrote:
hat sich von euch schon jemand Daten aus PDF tabellen extrahieren beschäftigt? Ich hätte gerne die Tabelle im Anhang von https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf als maschinenlesbare Daten.
Danke an alle für den Input und vor allem an Dirk für das Lösen der Aufgabe. Gruß Martin

Hi, On 24.09.2018 13:37, Martin Vietz wrote:
https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf als maschinenlesbare Daten.
da nachgefragt wurde hier die Daten aus der Tabelle. Gruß Martin

... danke, aber wie geht die Konvertierung? Viele Grüße, Andreas Am 27.09.2018 um 22:30 schrieb Martin Vietz:
Hi,
On 24.09.2018 13:37, Martin Vietz wrote:
https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf als maschinenlesbare Daten. da nachgefragt wurde hier die Daten aus der Tabelle.
Gruß Martin
-- Andreas Kugel Karlsruhe Germany
participants (3)
-
Andreas Kugel (akugel)
-
Florian.Brucker@it.karlsruhe.de
-
Martin Vietz