"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

Daten aus gesperrtem PDF ziehen

Burschi1620 10.04.2014 - 20:49 1992 14
Posts

Burschi1620

24/7 Santa Claus
Avatar
Registered: Apr 2004
Location: Drüber da Donau
Posts: 6792
Hi,

Bevor ich alles abtippe, wollte ich nachfragen...

Hab ein PDF mit zwei Tabellen zu je 2 spalten. Es handelt sich um zahlen. Rahmen.

Ich hab viel gegoogelt, converter probiert etc., is alles net gegangen. Dann hab ich ne gratis OCR Software probiert (mehrere) jeweils mit dem PDF aber auch als .jpg. War beides nicht zufriedenstellend.

Hat noch jemand eine Idee? Weil sonst fang ich zum abtippen an xD

Tia

Redphex

Legend
RabbitOfNegativeEuphoria
Avatar
Registered: Mar 2000
Location: Kadaverstern
Posts: 11811
bei PDFs, die nicht für Druck gesperrt sind hat bei mir bis jetzt funktioniert, die auf z.B. den PDFCreator hinzudrucken und den nochmal abspeichern lassen.

Mit Ghostscript kannst sicher auch ähnliches machen.

Burschi1620

24/7 Santa Claus
Avatar
Registered: Apr 2004
Location: Drüber da Donau
Posts: 6792
Zitat von Redphex
bei PDFs, die nicht für Druck gesperrt sind hat bei mir bis jetzt funktioniert, die auf z.B. den PDFCreator hinzudrucken und den nochmal abspeichern lassen.

Mit Ghostscript kannst sicher auch ähnliches machen.
Is leider für Druck gesperrt.

Mit Ghostscript komm ich nicht klar, die Helppage hilft mir nur bedingt weiter. Wenn ich das richtig versteh komm ich maximal auf ein image das ich vom pdf machen kann aber nicht verwertbaren Text. Aber ich komm ja noch nichtmal bis zum pdf Einlesen selbst :D
Dokus lesen war noch nie meine Stärke :D

Redphex

Legend
RabbitOfNegativeEuphoria
Avatar
Registered: Mar 2000
Location: Kadaverstern
Posts: 11811
Zitat von Burschi1620
Is leider für Druck gesperrt.

pervers :o
sorry, dann hab ich auch keinen erprobten Rat bei der Hand :(

Cobase

Mr. RAM
Avatar
Registered: Jun 2001
Location: Linz
Posts: 17885
OCR aufs Mobiltelefon und dann vom Monitor abfotografieren?

EDIT: Screenshot machen und dann OCR drüberlaufen lassen funktioniert auch nicht?

clauskadrnoschka

still oc.at-addicted
Avatar
Registered: Mar 2001
Location: Austria, Waldvie..
Posts: 1545
Screenshot machen, ausdrucken und mit OCR wieder einscannen? Ist zwar mit der Kirche übers Kreuz, aber zumindest ein Teil sicher ohne abschreiben zu holen...

Burschi1620

24/7 Santa Claus
Avatar
Registered: Apr 2004
Location: Drüber da Donau
Posts: 6792
Ja, also ORC geht nicht. kA ich hatte googlesuche: freeware ORC...
Da wurden viele Nummern nicht erkannt, da hat er mir einfach ein x statt der Zahl geschrieben. Und wenn er schon so manches nicht erkannt hab ich mir gedacht: Pfeiff drauf, weil sonst hast falsch-positive auch noch drinnen... (also falsche Zahl statt ein x)
Sehr strange, ich bin hab bessere Erinnerungen von OCR. Aber vl. is das bei freeware so? Vl ist das, weil die Tabelle Rahmen hat? Kennt ihr empfehlenswerte Software?
Bearbeitet von Burschi1620 am 10.04.2014, 22:33

kleinerChemiker

Here to stay
Avatar
Registered: Feb 2002
Location: Wien
Posts: 4248
Versuch mal Abbyy Finereader, gibt eh eine Testversion. Soll sehr hohe Erkennungsraten haben.
https://store.abbyyeu.com/cgi-bin/d...=EN?ID=FR12PETB

deagle

Addicted
Registered: May 2004
Location: Wien
Posts: 381
Die OCR-Funktion von Google Drive könntest du evtl. noch probieren, hat mir schon ganz brauchbare Ergebnisse geliefert und kostenlos wäre sie auch.

kleinerChemiker

Here to stay
Avatar
Registered: Feb 2002
Location: Wien
Posts: 4248
oder versuch mal das pdf in google translate hochzuladen. ich konnte mal so ein pdf extrahieren (und gleichzeitig übersetzen) das gesperrt war. Ich weiß jedoch nicht mehr, ob nur kopieren oder auch drucken gesperrt war.

Burschi1620

24/7 Santa Claus
Avatar
Registered: Apr 2004
Location: Drüber da Donau
Posts: 6792
Zitat von deagle
Die OCR-Funktion von Google Drive könntest du evtl. noch probieren, hat mir schon ganz brauchbare Ergebnisse geliefert und kostenlos wäre sie auch.

nachdem Abby fine reader mir noch immer keine Bestätigungsmail geschickt hat und ich auf Anhieb mal das probiert hab, haben wir einen gewinner *bingelingeling* :D

Danke! Es kommt zwar als sequenz und Zahlenwurscht hinten raus, aber das ist egal, weil Abstände dazwwischen sind.


Soooooooooooo
Jetzt wäre mir noch echt geholfen, wenn jemand sich mit Excel auskennen würde.
ich muss nachsehen wieviel bzw. welche Nummern in welcher Tabelle doppelt vorkommen :D Da ich keine Code Utility installiert hab (nein, nichtmal gcc :p), wär das jetzt etwas umständlich das extra zu installieren und was zu coden :D

ich hätte es folgendermaßen Probiert: =WENN(A1 = (B1:Bxx)) haut aber nicht wirklich hin....


edit: SVERWEIS heißt der Spaß. Hat sich erübrigt :)
Bearbeitet von Burschi1620 am 11.04.2014, 16:36

berndy2001

Komasäufer
Avatar
Registered: Feb 2003
Location: Vienna
Posts: 1931
falls doch noch relevant:
wenn du das pdf ohne passwort öffnen kannst (auch nicht per DRM geschützt ist), dann sollte es mit http://online2pdf.com/de/ oder http://www.pdfdu.com/pdf-remove-restriction.aspx gehen.
Bearbeitet von berndy2001 am 11.04.2014, 16:20

Burschi1620

24/7 Santa Claus
Avatar
Registered: Apr 2004
Location: Drüber da Donau
Posts: 6792
Zitat von berndy2001
falls doch noch relevant:
wenn du das pdf ohne passwort öffnen kannst (auch nicht per DRM geschützt ist), dann sollte es mit http://online2pdf.com/de/ oder http://www.pdfdu.com/pdf-remove-restriction.aspx gehen.
ja leck, das geht auch :) Sogar noch leichter weils excel 1:1 frisst.

danke :D

Redphex

Legend
RabbitOfNegativeEuphoria
Avatar
Registered: Mar 2000
Location: Kadaverstern
Posts: 11811
Hatte jetzt grad auch so einen Fall und habs schließlich mit ghostscript gemacht:

Code:
gswin64.exe -sDEVICE=pdfwrite -dNOPAUSE -sOutputFile=output.pdf input.pdf

Burschi1620

24/7 Santa Claus
Avatar
Registered: Apr 2004
Location: Drüber da Donau
Posts: 6792
Haha danke, dafür war ich sowieso zu blöd :D Aber gut es jetzt zu haben :D
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz