Allereerst, ik snap het belang en de kunst van goede prompting, en wat sommige nu in de kunstwereld voor super mooie beelden (2d of video) er mee kunnen maken, dat is echt niets iets wat iedereen zomaar kan, dat kan je als art vorm bestempelen, maar je gaat wel heel makkelijk voorbij aan de techniek zelf die dit allemaal mogelijk maakt. Of beter gezegd: de data die dat mogelijk maakt. Een goede LLM staat of valt bij de input van het model, de trainingsdata. En op dit moment zijn eigenlijk alle modellen illegaal bezig (in ieder geval moreel gezien, helaas loopt de wetgeving hier hopeloos achter). Zonder alle originele input van beelden, teksten of muziek zijn die modellen helemaal nergens. Ze teren op, of beter, parasiteren dus in feite op de creativitet van individuen die de originele werken hebben gemaakt, zonder dat de originele auteurs daar toestemming voor hebben gegeven, en laat staan dat ze daar een vergoeding voor hebben gekregen.
Gelukkig zit hier misschien ook een lichtpuntje in, zonder nieuwe input stort zo'n systeem (de LLM) uiteindelijk in elkaar, het is dus noodzakelijk dat je het systeem met nieuwe input voedt, maw daar is nieuwe originele creativiteit van mensen voor nodig. En de eerste gedachte van de meesten zal zijn: nou dan voeden we die systemen toch met data gegeneeerd door een andere AI: dat gaat helaas niet werken, je krijgt dan data degradatie, feedback, hallucinaties en allerlei andere data corruptie, de bekende kopie van een kopie issues zegmaar (en ik gebruik hier vast niet de correcte termen, ik ben zeker geen specialist in dit veld)