Zit je nog steeds vast bij “goed zijn in prompts”? — AI-evolutie en drie soorten engineering | フルトラ研のワールドナビ VRChat

*Dit artikel is gemaakt met AI-spraakinvoer (Aqua Voice). Houd er rekening mee dat er inconsistenties kunnen voorkomen.

Zit je nog steeds vast bij “goed zijn in prompts”? — AI-evolutie en drie soorten engineering

Hallo. Hoe gaat het met iedereen?

Ik ben Hiro van Full Body Tracking Lab.

Vandaag wil ik het, in plaats van de gebruikelijke full-body tracking-praat, over AI hebben.

Ik gebruik een AI-tool genaamd Claude Code voor allerlei dingen — artikelen schrijven, romans schrijven, Blender 3D-scripts genereren, en meer.

Maar het gewoon normaal gebruiken is niet genoeg.

Vandaag vertel ik hoe de manier waarop we AI gebruiken is geevolueerd, wat er is veranderd naast AI’s evolutie, en waarom ik ben uitgekomen bij de manier waarop ik het nu gebruik.

Er zijn drie generaties van AI-gebruik

Op basis van mijn ervaring met het gebruik van AI, voel ik dat de evolutie van gebruik grofweg in drie fasen kan worden verdeeld.

De eerste is “Prompt Engineering.”

De tweede is “Context Engineering.”

De derde is “Harness Engineering.”

Laat me ze elk uitleggen.

Generatie 1: Prompt Engineering

Als je AI uberhaupt gebruikt, zijn de meeste mensen hier waarschijnlijk begonnen.

Er is een chatscherm zoals LINE, je zegt “Doe alsjeblieft zus-en-zo,” en het antwoordt “Okey, hier is zus-en-zo.” Dat is de kern ervan.

Prompt engineering is de vaardigheid om die instructies goed te schrijven.

Bijvoorbeeld, zoiets als dit:

“Jij bent een professionele redacteur. Corrigeer de volgende tekst alsjeblieft.”

Je geeft de andere partij context en voorwaarden om meer gespecialiseerde antwoorden te ontlokken. De sleutel is het schrijven van goede instructies.

Dit blijft belangrijk, zelfs in latere generaties. Het had echter een fatale zwakte.

Je moet het elke keer opnieuw zeggen

“Jij bent een full-body tracking-onderzoeker, je schrijfstijl is informeel-beleefd…”

Dit moet je elke keer schrijven, binnen een beperkt aantal tekens.

AI kan niet alles onthouden, dus je moet zo beknopt mogelijk zijn, maar ook nauwkeurig.

Eerlijk gezegd had het zijn grenzen.

Het vergeet bij lange gesprekken

Mensen zijn hetzelfde, toch? Als je een tijdje blijft praten, eindig je met denken “Wacht, waar hadden we het oorspronkelijk over?” AI is hetzelfde.

Kwaliteit wordt inconsistent

Naarmate gesprekken langer worden, begint de kwaliteit te schommelen. Je stelt het in als “een full-body tracking-onderzoeker,” maar halverwege verandert het in een compleet ander personage.

Je kunt eerdere kennis niet benutten

Je zou willen zeggen “Absorbeer alsjeblieft alle informatie uit artikelen die ik eerder heb geschreven en gebruik het,” maar dat is onmogelijk. Er zit een limiet aan hoeveel AI tegelijk in zijn geheugen kan houden.

Uiteindelijk begon de aanpak van “alles proberen af te handelen met alleen prompts” zijn grenzen te tonen.

Dus werd de vraag: is er een andere manier? En AI-gebruik evolueerde in een nieuwe richting.

Generatie 2: Context Engineering

Wat is context engineering? Het is de vaardigheid van het ontwerpen van “welke informatie je AI laat zien, op welk moment, en in welke volgorde.”

Als prompts gaan over “wat te vragen,” dan gaat context over “wat je AI laat zien.”

Drie dingen om te doen

Ten eerste, voed het de nodige informatie.

Bij het laten schrijven van een artikel door AI, laad je van tevoren relevante eerdere artikelen, de nieuwste apparaatinformatie, lezersfeeback, enzovoort. Niet alles — alleen wat relevant is voor de huidige taak.

Vervolgens, beheer informatie-versheid.

Je beoordeelt “deze informatie is actueel” en “die informatie is verouderd,” en geef prioriteit aan het tonen van het nieuwere materiaal. Als je het “nieuwste aanbevelingen” laat schrijven op basis van oude informatie, wordt dat misleidend.

Tot slot, ontwerp de volgorde van informatie.

De volgorde waarin je dingen aan AI laat zien, verandert de output. “Help het eerst de VRChat-wereld te begrijpen. Help het dan full-body tracking-technologie te begrijpen. Presenteer tot slot het huidige onderwerp.” Die volgorde omdraaien produceert compleet andere resultaten.

Vier technieken

Context engineering wordt gezegd vier hoofdtechnieken te hebben.

Selectie: de benodigde informatie kiezen.

Compressie: informatie samenvatten en alleen de kernpunten doorgeven.

Segmentatie: informatie in blokken breken en in fasen presenteren.

Uitschrijven: onnodige informatie verwijderen om ruis te verminderen.

Alles tegelijk invoeren werkt eigenlijk averechts. De sleutel tot context engineering is alleen presenteren wat nodig is, in de vorm waarin het nodig is.

Generatie 3: Harness Engineering

De laatste die opkwam is harness engineering.

Wanneer je “harness” hoort, denken sommige mensen misschien aan autobedrading. Maar de harness waarover ik het hier heb verwijst oorspronkelijk naar de complete set uitrusting voor het besturen van een paard. Gereedschap dat een paard in de juiste richting leidt.

Harness engineering is de vaardigheid van het ontwerpen van de omgeving zelf waarin AI opereert, zodat het altijd in de juiste richting draait.

Overeenkomsten met testharnesses

Trouwens, aangezien Anthropic — het bedrijf dat Claude Code maakt — een softwarebedrijf is, denk ik dat deze “harness” dezelfde etymologie deelt als “testharness.”

Een testharness is een softwareontwikkelingsterm voor een systeem dat de uitvoeringsomgeving van een testdoel structureel controleert en resultaten verifieerbaar maakt.

Uitrusting om een paard correct te laten rennen. Een systeem om testdoelen correct te verifieren. Omgevingsontwerp om AI correct te laten werken. Ze zijn allemaal verbonden.

Wat doe ik eigenlijk?

Laat me de harness introduceren die ik daadwerkelijk heb gebouwd.

Ten eerste: Skills (Persona’s).

Regels als “Hiro schrijft zo,” “dit is verboden” worden gedefinieerd in bestanden. AI leest deze bestanden en opereert vanaf het begin vanuit de premisse “ik ben Hiro.”

Niet nodig om elke keer “Jij bent Hiro” in de prompt te schrijven. Het staat al op dat spoor.

Ten tweede: Kennisbank.

Artikelen die ik in het verleden heb geschreven, VRChat-kennis, informatie over full-body tracking-apparaten. Dit alles is georganiseerd in mappen, en AI kan het raadplegen wanneer nodig.

Niet nodig om elke keer “Full-body tracking is een technologie die de beweging van het hele lichaam volgt…” in de prompt te schrijven. Het weet hoe het moet zoeken en hoe het de kennis kan vinden.

Ten derde: Workflow.

Er is een vaste procedure voor het schrijven van artikelen: bevestig het thema, ontwerp het verborgen thema, maak een schets, schrijf, herzie. Deze procedure staat geschreven in een bestand, zodat AI stap voor stap kan werken aan “waar eerst over na te denken.”

Ten vierde: Geheugen.

Gegevens als “deze persoon nam eerder dit besluit” en “dit beleid werd vastgesteld voor dit project” worden opgeslagen in bestanden, en AI kan ze lezen in nieuwe sessies.

Dit is misschien de grootste. Geheugen draagt over voorbij de grenzen van het contextvenster.

Ten vijfde: Kwaliteitscontroles (Checkers).

Wanneer AI output produceert, gaat het niet direct naar publicatie. Een checker draait automatisch. “Komt het overeen met de oorspronkelijke definitie?” “Is het perspectief correct?” Als iets faalt, gaat het proces terug naar het begin van het stroomdiagram en doet het opnieuw.

In plaats van “Wees voorzichtig” te zeggen in een prompt, zijn controles ingebouwd in het systeem.

Het verschil tussen “verzoeken” en “systemen”

Het belangrijke punt hier is: “Maar waren er niet ook conditiedefinities als ‘doe het zo’ en ‘schrijf het zo’ in de context engineering-fase?”

Ja, die waren er. Maar die conditiedefinities waren eigenlijk gewoon verzoeken.

Zelfs als je zei “Doe dit niet” of “Schrijf niet zo,” er was geen systeem dat het juiste pad waarborgte. Aangezien het verzoeken waren, kon AI ze vergeten of negeren.

Harness engineering is geen verzoek — het is structuur. Het legt rails zodat AI alleen in de juiste richting kan rijden. Dat is het fundamentele verschil.

Alle drie naast elkaar vergelijken

Laat me alles tot nu toe in een keer ordenen.

Prompt Engineering:

De vaardigheid van het maken van goede “bestellingen” aan AI.

In restauranttermen: je bestelling plaatsen.

Context Engineering:

De vaardigheid van het geven van de “juiste ingredienten” aan AI.

In restauranttermen: de juiste ingredienten inkopen.

Harness Engineering:

De vaardigheid van het ontwerpen van de “keuken” waar AI in werkt.

In restauranttermen: de keuken ontwerpen.

Ze zijn compleet verschillend, toch? Maar je hebt alle drie nodig.

De beste bestelling (prompt) x de beste ingredienten (context) x de beste keuken (harness).

Wanneer alle drie samenkomen, kan AI daadwerkelijk koken. Als er een ontbreekt, werkt het niet.

Een huis-analogie maakt het nog duidelijker

Voor wie de restaurant-analogie niet helemaal aanvoelde, hier een huisversie.

Harness = Fundering. Eenmaal gebouwd, gaat het eeuwig mee.

Context = Muren en pilaren (structuur). Kan per taak worden aangepast.

Prompt = Interieurontwerp (meubelindeling). Kan elke keer worden veranderd.

Een solide fundering, goede muren en goed gerangschikte interieurs. Alleen wanneer alles samenkomt, wordt het een “huis.”

Omgekeerd, hoe uitgebreid het interieur (prompt) ook is, zonder de fundering (harness) bouw je elke keer opnieuw. Zonder muren (context) heb je niet eens een kamer.

Praktijkvoorbeeld — Hoe ik “De Metaverse-minnaar” schreef

Waar ik het verschil tussen deze drie het sterkst voelde, was bij de roman “De Metaverse-minnaar,” alle 12 hoofdstukken, die ik onlangs schreef.

Wat zou er gebeuren met alleen prompts?

“De setting is VRChat, het thema is romantiek in een virtuele wereld, schrijf het alsjeblieft in 12 hoofdstukken.”

Dat schrijven, corrigeren wat eruit komt, meer instructies geven, weer corrigeren. Herhalen.

Hier komt iets uit. Maar wat je krijgt is een “AI-achtige roman.” De VRChat-beschrijvingen zijn oppervlakkig, en de emotie van full-body tracking komt niet door.

Wat ik deed

Ik gebruikte alle drie de lagen.

Op promptniveau:

“Dit hoofdstuk gaat ongeveer zo.” “Deze scene moet deze sfeer hebben.” Ik hield individuele instructies simpel.

Op contextniveau:

Ik laadde de inhoud van eerdere hoofdstukken in, VRChat’s nieuwkomersgidscultuur, de emotionele ervaring van full-body tracking, en de sfeer van danszalen. De informatie die dit specifieke hoofdstuk nu nodig had.

Op harnessniveau:

De “Hiro”-persona zorgde voor VRChat-authenticiteit. De kennisbank zorgde voor nauwkeurige full-body tracking-beschrijvingen. Kwaliteitscontroles bevestigden “Is er iets onrealistisch voor VRChat?” en “Is het verhaal coherent?” Geheugen behield consistentie over alle 12 hoofdstukken.

Het moeilijkste, eerlijk gezegd, was de context. Als je iets niet zelf onder woorden kunt brengen, kun je het ook niet aan AI overbrengen. Dat “specifieke VRChat-gevoel” verwoorden is oprecht moeilijk. Er waren veel mislukkingen.

Maar wanneer alle drie klikten, was ik in staat om een 12-hoofdstukken lang werk te schrijven met consistente kwaliteit. Als een enkel element had ontbroken, denk ik niet dat het was gelukt.

De drie staan niet tegenover elkaar — het zijn lagen

“Is prompt engineering dan nu verouderd?”

Absoluut niet.

Ik legde uit dat de drie tot verschillende generaties behoren, maar dat betekent niet dat de oudere onnodig worden. Je gebruikt ze allemaal. Het zijn gewoon verschillende lagen.

Zelfs na het bouwen van een harness, geef je nog steeds instructies op promptniveau: “Schrijf dit hoofdstuk zo.”

Zelfs als de context goed geordend is, als de prompt slordig is, zal de output slordig zijn.

Alleen wanneer alle drie samenkomen, kan AI op zijn volle potentieel presteren.

Samenvatting

Met alleen prompts ben je een klant die elke keer opnieuw bestellingen plaatst.

Wanneer je de context ordent, krijgt AI goede ingredienten, en de kwaliteit van de output schiet omhoog.

Zodra je een harness bouwt, wordt AI een teamgenoot. Het draagt je kennis, werkt in jouw stijl, en draait namens jou.

Ik ben een full-body tracking-onderzoeker, maar het is hetzelfde met full-body tracking.

Met alleen een headset en controllers (= alleen prompts) kun je de virtuele wereld betreden.

De juiste wereld kiezen (= de context ordenen) verandert de kwaliteit van de ervaring.

Full-body tracking-sensoren aandoen, kalibreren en de omgeving instellen (= de harness bouwen) — pas dan krijg je het gevoel van “er zelf zijn.”

Het is hetzelfde met AI.

Alleen wanneer je alle drie de lagen op een lijn brengt, wordt het “jouw AI.”

Ik hoop dat jullie allemaal de stadia zullen proberen die voorbij prompts liggen.

Hiro

Bedankt voor het lezen! Volg ons op X en abonneer je op ons YouTube-kanaal!

Zit je nog steeds vast bij “goed zijn in prompts”? — AI-evolutie en drie soorten engineering

検索

Er zijn drie generaties van AI-gebruik

Generatie 1: Prompt Engineering

Je moet het elke keer opnieuw zeggen

Het vergeet bij lange gesprekken

Kwaliteit wordt inconsistent

Je kunt eerdere kennis niet benutten

Generatie 2: Context Engineering

Drie dingen om te doen

Vier technieken

Generatie 3: Harness Engineering

Overeenkomsten met testharnesses

Wat doe ik eigenlijk?

Het verschil tussen “verzoeken” en “systemen”

Alle drie naast elkaar vergelijken

Een huis-analogie maakt het nog duidelijker

Praktijkvoorbeeld — Hoe ik “De Metaverse-minnaar” schreef

Wat zou er gebeuren met alleen prompts?

Wat ik deed

De drie staan niet tegenover elkaar — het zijn lagen

Samenvatting

関連

Er zijn drie generaties van AI-gebruik

Generatie 1: Prompt Engineering

Je moet het elke keer opnieuw zeggen

Het vergeet bij lange gesprekken

Kwaliteit wordt inconsistent

Je kunt eerdere kennis niet benutten

Generatie 2: Context Engineering

Drie dingen om te doen

Vier technieken

Generatie 3: Harness Engineering

Overeenkomsten met testharnesses

Wat doe ik eigenlijk?

Het verschil tussen “verzoeken” en “systemen”

Alle drie naast elkaar vergelijken

Een huis-analogie maakt het nog duidelijker

Praktijkvoorbeeld — Hoe ik “De Metaverse-minnaar” schreef

Wat zou er gebeuren met alleen prompts?

Wat ik deed

De drie staan niet tegenover elkaar — het zijn lagen

Samenvatting

シェア＆RTお願いします！

関連