"We are back" « oc.at

KI, die pdf Files interpretiert und zusammenfasst

grOOvekill@ 26.03.2025 - 13:42 8135 38
Posts

Deleted84616


Registered: Nov 2025
Location:
Posts: 0
Ich sag's ja immer, pro models sind der reinste scam

charmin

Vereinsmitglied
stay classy!
Avatar
Registered: Dec 2002
Location:  
Posts: 16285
Zitat aus einem Post von Kirby
Gestern probiert eine 500 Seiten pdf zusammenfassen zu lassen.
Zuerst die englische pdf zusammenfassen, das ganze dann in deutsch umwandeln und als pdf wieder zurückgeben.
GPT so: ich melde mich wenn es fertig ist.
Ich dann 2 Stunden später: Wie schauts aus?
GPT: joa braucht bissl länger. Ich melde mich wenn ich fertig bin.

Bis heut is nix passiert. Dann frag ich grad nochmal wies den ausschaut.
GPT: Ich fasse gerade die 3 Hauptpunkte zusammen blablabla. ich bin in 15-20min fertig.

ich glaub die mag mich einfach nimmer

ich vermute einfach viel zu langer kontext für das modell.
probiers mal im agenten modus.

Deleted84616


Registered: Nov 2025
Location:
Posts: 0
Vorher parsen mit Docling oder megaparse fällt mir als Alternative zu multi agent ein, ich habe lieber einen den ich schimpfen kann, als ganz viele :)

Wenn's bei Docling hilfe brauchst gern pn

charmin

Vereinsmitglied
stay classy!
Avatar
Registered: Dec 2002
Location:  
Posts: 16285
in der firma lösen wir sowas mit jeweils einem eigenen agenten für jedes PDF.
aber bei 500 seiten wird das schwer. da würde ich wohl jeweils 10 seiten durch je einen agenten durchjagen und zusammenfassen und dann diese zusammenfassung von einem end agenten zusammenfassen lassen.

schön langsam kommt jeder drauf was die limitierungen sind.

Kirby

0x1B
Avatar
Registered: Jun 2017
Location: Lesachtal
Posts: 1116
click to enlarge

Deleted84616


Registered: Nov 2025
Location:
Posts: 0
Du kannst "normale" LLMs/GTPs nicht zum parsen für viel Kontext verwenden, das geht sich rechnerisch nicht aus. Egal welches Modell, du brauchst einen Parser.

Willst du dass er auch Kontext von Bildern versteht? Also Multimodal? Oder Monomodal?

Daeda

Renegade
Registered: Aug 2007
Location: Graz
Posts: 1815
Zitat aus einem Post von Kirby
obwohl ich das 20er model zahle aha

was bitte ist das 20er model?

Deleted84616


Registered: Nov 2025
Location:
Posts: 0
Wohl das, was ca 20e kostet meint der Kolleg vmtl

Kirby

0x1B
Avatar
Registered: Jun 2017
Location: Lesachtal
Posts: 1116
Zitat aus einem Post von Dune
Willst du dass er auch Kontext von Bildern versteht? Also Multimodal? Oder Monomodal?

Nein. Da sind nämlich 0 Bilder drinnen.


Zitat
probiers mal im agenten modus.

alles klar. parser werd ich au noch probieren.
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz