Hallo Martin,

hast Du es schon mit Tabula (https://tabula.technology/) probiert? Die großen Downloadbuttons auf der Homepage gibt es nur für Win & Mac, aber im Text findest Du auch Hinweise auf Linux.


Viele Grüße
Florian Brucker
--
Stadt Karlsruhe
Amt für Informationstechnik und Digitalisierung
Open Government
Zähringerstraße 61, 76133 Karlsruhe
Tel: +49 721 133-1762
Bürozeiten: Montag + Dienstag ganztägig, Mittwoch nachmittags



"Codeforkarlsruhe" <codeforkarlsruhe-bounces@mlists.okfn.de> schrieb am 24.09.2018 13:37:45:

> Von: Martin Vietz <martin@entropia.de>

> An: codeforkarlsruhe@mlists.okfn.de,
> Datum: 24.09.2018 13:37
> Betreff: [Codeforkarlsruhe] PDF parsen
> Gesendet von: "Codeforkarlsruhe" <codeforkarlsruhe-bounces@mlists.okfn.de>
>
> Hi,
>
> hat sich von euch schon jemand Daten aus PDF tabellen extrahieren
> beschäftigt? Ich hätte gerne die Tabelle im Anhang von
>
https://dipbt.bundestag.de/dip21/btd/19/029/1902914.pdf als
> maschinenlesbare Daten.
>
> Vielen Dank im Voraus!
>
> Gruß Martin
>
> --
> Codeforkarlsruhe mailing list
> Codeforkarlsruhe@mlists.okfn.de
>
https://mlists.okfn.de/cgi-bin/mailman/listinfo/codeforkarlsruhe