Hallo Martin,
hast Du es schon mit Tabula (https://tabula.technology/)
probiert? Die großen Downloadbuttons auf der Homepage gibt es nur für Win
& Mac, aber im Text findest Du auch Hinweise auf Linux.
Viele Grüße
Florian Brucker
--
Stadt Karlsruhe
Amt für Informationstechnik und Digitalisierung
Open Government
Zähringerstraße 61, 76133 Karlsruhe
Tel: +49 721 133-1762
Bürozeiten: Montag + Dienstag ganztägig, Mittwoch nachmittags
"Codeforkarlsruhe" <codeforkarlsruhe-bounces@mlists.okfn.de>
schrieb am 24.09.2018 13:37:45:
> Von: Martin Vietz <martin@entropia.de>
> An: codeforkarlsruhe@mlists.okfn.de,
> Datum: 24.09.2018 13:37
> Betreff: [Codeforkarlsruhe] PDF parsen
> Gesendet von: "Codeforkarlsruhe" <codeforkarlsruhe-bounces@mlists.okfn.de>
>
> Hi,
>
> hat sich von euch schon jemand Daten aus PDF tabellen extrahieren
> beschäftigt? Ich hätte gerne die Tabelle im Anhang von
> https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf
als
> maschinenlesbare Daten.
>
> Vielen Dank im Voraus!
>
> Gruß Martin
>
> --
> Codeforkarlsruhe mailing list
> Codeforkarlsruhe@mlists.okfn.de
> https://mlists.okfn.de/cgi-bin/mailman/listinfo/codeforkarlsruhe