"We are back" « oc.at

KI-Tools - der Sammelthread

charmin 13.08.2024 - 14:00 46521 158 Thread rating
Posts

charmin

Vereinsmitglied
stay classy!
Avatar
Registered: Dec 2002
Location:  
Posts: 16388
Mehr RAM oder ein MoE Modell nehmen wo nur ein Subset der Parameter aktiv ist.

Viper780

Elder
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 52487
Mehr RAM kann ich in der Firma nicht beeinflussen und privat will ichs nicht zahlen (Umstieg auf DDR5 und dann die Preise vom Speicher selbst)

Daeda

Renegade
Registered: Aug 2007
Location: Graz
Posts: 1832
Das openweight LLM GLM-5 geht grad ziemlich gut ab, in Benchmarks quasi gleich gut wie Opus 4.5-4.6 und GPT 5.2.
Bei Kilo Code (cli ist ein opencode fork, gibt auch IDE extensions) ist es aktuell gratis testbar und ich finds bisher wirklich sehr stark: https://blog.kilo.ai/p/glm-5-free-limited-time

Im z.ai Abo gibts GLM-5 aktuell nur im 2.- und 3.-höchsten Tier, im niedrigsten kommts erst in ein paar Tagen. Aber man will ja generell nicht über chinesische Server gehen, daher besser openrouter, huggingface oder whatever - the beauty of open weight! :)

Apropos:

daisho

Vereinsmitglied
SHODAN
Avatar
Registered: Nov 2002
Location: 4C4
Posts: 20091
Nachdem ihr da alles lokal laufen habt, auf was für Maschinen habt ihr das laufen?
Kann mir ja vorstellen dass das dann extrem zach lauft? Ich meine man wartet ja schon bei Google bis da Sachen abgearbeitet werden (sudern auf hohem Niveau klarerweise, ohne AI würd die Arbeit vermutlich Wochen dauern oder man gibt einfach auf ...)

Dreamforcer

New world Order
Avatar
Registered: Nov 2002
Location: Tirol
Posts: 9212
hat jemand ein ki tool für foto tagging in lightroom , dass man empfehlen kann ?

daisho

Vereinsmitglied
SHODAN
Avatar
Registered: Nov 2002
Location: 4C4
Posts: 20091
Ist Gemini jetzt komplett hinüber?
Ich bekomme den ganzen Tag ständig 503er, lt. Google hab ich für alle Models 100% Remaining (bei Flash im Moment noch 80% für die paar Requests die durchgegangen sind - der Rest vermutlich für "nothing" verbraucht) aber es geht eigentlich nix ...

BiG_WEaSeL

Elder
-
Avatar
Registered: Jun 2000
Location: Wien
Posts: 8664
Sprichst du von API Nutzung? Im Chatinterface hab ich nämlich keine Probleme.

daisho

Vereinsmitglied
SHODAN
Avatar
Registered: Nov 2002
Location: 4C4
Posts: 20091
Chat failed bei mir auch manchmal, aber ja ... Chat ist wesentlich besser als via API (Agents), über Antigravity Gemini API geht da fast gar nichts heute.

charmin

Vereinsmitglied
stay classy!
Avatar
Registered: Dec 2002
Location:  
Posts: 16388
@daisho würde dir eher GitHub Copilot ans Herz legen. Höhere usage Limits und kostet 8 bzw 28 USD pro Monat. Ich nutz das mit GSD und opencode (da ich die GitHub Copilot cli med leiden kann) unter vs Code. Haben auch die interessanten Modelle wie Opus 4.6 und sonnet 4.6.

daisho

Vereinsmitglied
SHODAN
Avatar
Registered: Nov 2002
Location: 4C4
Posts: 20091
Warum nicht Claude Code?
Bei mir wärs eher für die komplexeren Analysen/Coding, für einfache Dinge hab ich eh den Chat und der geht eh "meistens". Gemini hat halt den Vorteil das ich Pro schon habe weil ich Google Workspace sowieso schon habe ... aber dass das gar nicht funktioniert ist halt schon ziemlich kacke (und dann verschwinden natürlich auch noch die Tokens die nichts zurückgebracht haben ...).
Ich vermute ja der Demand ist einfach so riesig bei Google im Moment das sie nicht mehr hinterherkommen?

Viper780

Elder
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 52487
Google API war bei mir auch immer recht unzuverlässig.
Wegen Kunden Projekt bin ich aber sowieso an Github Copilot gebunden.

In VS Code klappt es super auch für komplexe Analysen (im Plan Mode) und dann strukturierte Umsetzung (Agent Mode)

charmin

Vereinsmitglied
stay classy!
Avatar
Registered: Dec 2002
Location:  
Posts: 16388
Claude Code geht auch. Kostet aber mehr für dieselbe Anzahl an requests.

Für komplexe Dinge ganz klar: opencode mit GSD.
Gemini Pro hab ich auch. Aber viel zu wenig requests und nicht nutzbar mit opencode oder GitHub CLI.

daisho

Vereinsmitglied
SHODAN
Avatar
Registered: Nov 2002
Location: 4C4
Posts: 20091
Werd ich mir mal ansehen, weil mit den 90% Abbrüchen kann ich eh nichts arbeiten.

Viper780

Elder
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 52487
Wie gehst du mit compliance bei Google um? Nehme an du machst damit Sache für die Arbeit und Kunden.

@charmin
Mit GSD meinst du Get Shit Done? Also das Spec Driven Design Framework für Gemini und Claude Code?
Hab mit SpecKit und OpenSpec angesehen und werde mir auch noch BMAD vornehmen

charmin

Vereinsmitglied
stay classy!
Avatar
Registered: Dec 2002
Location:  
Posts: 16388
Ja genau!
Ich verwende es mit opencode, weil mir das viel besser daugt als GitHub Copilot CLI!

https://github.com/gsd-build/get-shit-done

https://opencode.ai/

als LLM nehm ich opus 4.6 und sonnet 4.6 uber github copilot!
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz