Hoe AI steeds beter wordt in software development – mijn ervaring met Kittens vs Turtles

Waarom ik games gebruik om AI developers te testen

Als je echt wilt weten of een AI developer jouw prompts begrijpt, dan moet je niet blijven hangen in standaardprompts of steeds nieuwe dingen proberen. Ik geloof in testen met iets waar ik gevoel bij heb en waar ik direct kan beoordelen: een game, en dan ook nog eens steeds dezelfde game met dezelfde specificaties. Alleen door steeds hetzelfde te testen kun je de vooruitgang in de opgeleverde output echt meten.

One Prompt Runner

Afgelopen weekend was het raak. Dankzij een grote AI-update en een nieuwe aanpak in Claude (de updates zijn tegenwoordig amper bij te houden) lukte het voor het eerst om een echt speelbaar prototype uit mijn prompt te persen.

Nadat ik een Claude project ingericht had met diverse rollen en instructies heb ik eerst een test gedaan waar deze “One Prompt Runner” uitgekomen is. Een game die half werkt (, maar die dus daadwerkelijk met één prompt (zonder duidelijke roadmap, prd of MoSCoW) en nog een ronde debuggen live stond, letterlijk in totaal nog geen vijf minuten werk dus:

Kittens vs Turtles: geen dertien-in-een-dozijn prompt

Al sinds AI pretendeert om te kunnen coden leg ik AI developers en vibe-coding-apps dezelfde redelijk uitgebreide opdracht voor:

“Bouw een volledig speelbare tower defense game: Kittens vs Turtles”

Niet gewoon met blokjes en ballen, maar met een compleet thema, grappige animaties, verschillende torens en vijanden. De volledige prompt kun je hiernaast zien (of hieronder als je op je telefoon ofzo kijkt).

De kittens verdedigen hun Melkfontein tegen de meest malle turtles in vermommingen; Ninja Turtle, Surfer Turtle, Jetpack Turtle, je snapt het plaatje. De lijst met eisen is redelijk uitgebreid, en dat is precies waarom het zo’n goede test is.

De doorbraak: eindelijk een werkende versie

Het mooiste van alles; ik heb geen externe graphics of geluid hoeven gebruiken, en toch staat hier het eerste werkende level gewoon live. Het is nog geen echte game, alleen het eerste level werkt enigszins en het is ENORM gemakkelijk, maar goed, het werkt dus al wel! Misschien zou ik er de andere levels en ontbrekende elementen nog wel aan toe kunnen voegen, maar daar ga ik niet aan beginnen; dat kost teveel tijd die ik niet kan missen en AI is simpelweg nog niet consistent genoeg voor grotere projecten.

alleen het eerste level werkt, de victory of defeat aankondigingen nog niet, en het tweede level ook niet
ik heb zelf helemaal niets aan de code gedaan, en dus ook geen externe files toegevoegd

Waarom een game als test?

Waarom test ik AI met een game? Heel simpel: ik zie meteen of alles klopt. Een bug of onbegrip in de prompt betekent direct een vastloper in het spel. Bovendien kan ik met een game makkelijk scenario’s en details toevoegen die AI echt laten zweten.

Eerder heb ik ook al verschillende games gemaakt, zoals die voor Reusel Kermis en de Cocktail Mixer voor mijn maatje van Slijterij Dennis Meijs in Bergeijk, maar daar heb ik zelf veel meer aan en in gedaan (beetje aan de code gesleuteld, maar bijvoorbeeld ook extern de graphics en het geluid gemaakt).

Die ervaring helpt: als je weet wat bij spelontwikkeling komt kijken, zie je sneller waar het misgaat en wat werkt.

Wat betekent dit voor jou?

Gebruik jij AI om te testen, experimenteren of zelfs bouwen? Mijn tip: maak het tastbaar. Kies een project waar je gevoel voor hebt. Wees niet bang om iets te vragen dat “te moeilijk” lijkt. Of het nou een nieuwe webapplicatie is, een game, of een innovatieve tool: met echte scenario’s die je zelf goed begrijpt kun je de output van AI simpelweg het allerbest testen.

Ook als je ‘gewoon’ AI gebruikt met prompts en de output daarvan zou ik regelmatig vragen stellen waar je zelf de antwoorden al heel erg goed op weet, zodat je ook echt ervaart of de AI waar je mee werkt in de juiste richting zit.

Wat nu? Versie 2? Hoe verder?

Kittens vs Turtles is dus nog lang niet af, verre van zelfs. Maar de basis ligt. In versie 2 ga ik doorontwikkelen: meer levels, betere animaties, geluid, meer interactie en slimme AI-tegenstanders.

Wanneer versie 2 er gaat komen weet ik nog niet, want ik ga pas weer verder werken na de volgende ronde updates aan AI developers of als ik weer een nieuwe tool tegenkom die ik wil testen. Vast staat dat ik dan weer begin met dezelfde prompt (ja, die zou ik ondertussen natuurlijk veel beter kunnen maken, maar dan is mijn benchmark weg, dus dat doe ik hier niet haha), en dat ik er maximaal een paar uur mee bezig mag zijn om te debuggen.

Conclusie

AI in game en software development: het is nog verre van perfect, maar het is nooit saai (wel gruwelijk frustrerend soms). Met iedere nieuwe update en nieuw model wordt het beter. Mijn advies: experimenteer zelf en blijf kritisch testen.

Wie weet staat jouw eigen project straks ook live en speelbaar op een manier die je een jaar geleden niet had durven dromen.

Interesse om mee te denken, testen of gewoon benieuwd naar meer games? Check dan vooral even het overzicht van eerdere games of neem contact op.

Update: Base44 knalt er nog even overheen, Versie 2 (full game) is nu ook live 🙂

Dus ik publiceer dit stuk en deel het op LinkedIn, zegt David tegen me dat ik Base44 eens moet proberen… Ik heb mijn prompt erin geplakt en 4 keer gezegd “ga maar door tot het klaar is” en voila: Kitten VS Turtles op Base44 – met alle levels, enemies en towers werkend!!

Ik zei toch al dat het niet bij te houden is?! Zit ik hier mijn hele blog te schrijven, supertrots dat ik in een halve dag 1 leveltje speelbaar heb gekregen, rammel ik er daarna in 5 berichten de hele app uit haha.