"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

KI-Modelle: GPT, xLSTM, Stable Diffusion, etc

phono 27.01.2023 - 13:10 69242 555
Posts

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13953
Herst Bender :D

@Hansmaulwurf: aber ja, könnte man drüber streiten was genau jetzt mit probieren gemeint is. Theoretisch probierst nach jedem Trainingsbatch indemst auf dem validation set schaust wie gut das Netz generalisiert.

edit: is das jetz offtopic? Wohl eher schon.

Bender

Banned by Moderators
Avatar
Registered: Apr 2001
Location: Here..
Posts: 4980
ja, völlig, ich dachte ich rede mit meiner älteren Sister, sie kenn siggi ;)
Bearbeitet von Bender am 25.03.2023, 12:43

Hansmaulwurf

u wot m8?
Avatar
Registered: Apr 2005
Location: VBG
Posts: 5639
Zitat aus einem Post von charmin
Ja, aber einstellen tust du den hyperparameter net während des trainings.Du definierst vorm Training das Verhalten und dann läuft das. Selbes mir temperature annealing bei softmax.
Ja, aber:
Zitat aus einem Post von charmin
Probiert wird da nix, sondern Parameter angepasst die den Fehler verringern.
Dropout Layer droppen zufällig inputs während einzelnen Traininsschritten. Wenn sich das als vorteilhaft erweist, dann wird das übernehmen, insofern _probiert_ das Modell während dem Training Konfigurationsänderungen an der Struktur des Netzes.



Zitat aus einem Post von charmin
Edit: um was es mir geht: wenn irgendein Hansl im Netz Chat gpt nutzt und dem als input irgend ein Wissen gibt. Dann wird das nicht einfach so übernommen.
Nein, aber es gibt einen reinforcement learning process wo er anhand von sowas lernen kann, bzw. sogar trainiert wurde:
Zitat
The creators have used a combination of both Supervised Learning and Reinforcement Learning to fine-tune ChatGPT, but it is the Reinforcement Learning component specifically that makes ChatGPT unique. The creators use a particular technique called Reinforcement Learning from Human Feedback (RLHF), which uses human feedback in the training loop to minimize harmful, untruthful, and/or biased outputs.
https://www.assemblyai.com/blog/how...actually-works/
Ich weiß aber nicht ob das Inputs sind von den Leuten die das supervised learning überwachen oder auch inputs die irgendwo von normalen Usern eingegeben wurden.

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13953
Hach, endlich jemand mit dem ich hier drüber quatschen kann. Wollen wir an eigenen thread machen? :)

Hansmaulwurf

u wot m8?
Avatar
Registered: Apr 2005
Location: VBG
Posts: 5639
Über die Chatgpt details können wir gerne quatschen, aber bei den neuronalen Netzen bin ich nur seh oberflächlich informiert, da ist mein Input quasi eh schon aus :D

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13953
Ich bin auch nur gschaftler, keine Sorge. :D ich mach dann mal einen auf.

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13953

Vielleicht zieh ich mir das mal rein. Wenn die Videos vom lex ned immer so lange dauern würden...

Bender

Banned by Moderators
Avatar
Registered: Apr 2001
Location: Here..
Posts: 4980
@ Charmin THX - schau ich grad..


Wissen sie mehr, oder..

Eine ethisch/moralische Basis für solche Einheiten wäre wünschenswert aber ich zweifle daran, weil das wohl zu einem großen teil vom Militär ausgeht.

Spannende Zeiten..

InfiX

she/her
Avatar
Registered: Mar 2002
Location: Graz
Posts: 13731
naja was muss man dafür groß wissen, sieht man doch... aber die katze ist leider schon ausm sack.

Bender

Banned by Moderators
Avatar
Registered: Apr 2001
Location: Here..
Posts: 4980
Wir haben derzeit noch keine General MI/AI.. und darum gehts

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13953
Microsoft verdient sauviel Kohle mit ihrem neuen Produkt.
Apple und Musk: mimimimi.

Bender

Banned by Moderators
Avatar
Registered: Apr 2001
Location: Here..
Posts: 4980
Die sehr spezifischen Ansätze die wir momentan haben, sind noch Jahre(zehnte) von etwas wirklich gefährlichem entfernt. Man sollte nur anfangen drüber nachzudenken. Denke ich - als lesser Intelligence ;)

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5776
Zitat aus einem Post von charmin
Microsoft verdient sauviel Kohle mit ihrem neuen Produkt.
Apple und Musk: mimimimi.

Wozniak und Mostaque (CEO von Stability AI) haben ebenfalls unterzeichnet.

Ich persönlich bin aber trotzdem gegen jegliche Regulierung. Wenn wir uns selbst vernichten ham mas einfach verdient. :)

Bender

Banned by Moderators
Avatar
Registered: Apr 2001
Location: Here..
Posts: 4980
Regulierung wird sowieso nicht funktionieren _> cos Militär

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13953
Zitat aus einem Post von Vinci
Wozniak und Mostaque (CEO von Stability AI) haben ebenfalls unterzeichnet.

Ich persönlich bin aber trotzdem gegen jegliche Regulierung. Wenn wir uns selbst vernichten ham mas einfach verdient. :)

Also noch zwei die nicht dran verdienen. Cool.

Bitte schaltets alles ab a halbes Jahr damit wir auch was aufn markt werfen können. :D
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz