Nadal tkwisz na etapie “bycia dobrym w promptach”? — Ewolucja AI i trzy rodzaje inżynierii | フルトラ研のワールドナビ VRChat

*Ten artykuł został stworzony przy użyciu wejścia głosowego z AI (Aqua Voice). Prosimy o uwagę na możliwe nieścisłości.

Nadal tkwisz na etapie “bycia dobrym w promptach”? — Ewolucja AI i trzy rodzaje inżynierii

Cześć. Jak się macie?

Jestem Hiro z Laboratorium Full Body Tracking.

Dziś, zamiast zwykłej rozmowy o śledzeniu całego ciała, chcę porozmawiać o AI.

Używam narzędzia AI o nazwie Claude Code do najróżniejszych rzeczy — pisania artykułów, pisania powieści, generowania skryptów 3D w Blenderze i wielu innych.

Ale samo normalne używanie nie wystarczy.

Dziś opowiem o tym, jak sposób korzystania z AI ewoluował, co się zmieniło wraz z ewolucją AI i dlaczego doszedłem do sposobu, w jaki teraz z niego korzystam.

Istnieją trzy generacje korzystania z AI

Na podstawie mojego doświadczenia z AI uważam, że ewolucję użytkowania można podzielić na trzy etapy.

Pierwszy to “Prompt Engineering” (inżynieria promptów).

Drugi to “Context Engineering” (inżynieria kontekstu).

Trzeci to “Harness Engineering” (inżynieria uprzęży).

Pozwólcie, że wyjaśnię każdy z nich.

Generacja 1: Prompt Engineering

Jeśli w ogóle korzystasz z AI, większość ludzi prawdopodobnie zaczęła właśnie tutaj.

Jest ekran czatu jak w komunikatorze, mówisz “proszę, zrób to i to”, a AI odpowiada “jasne, oto to i to”. Na tym to polega.

Prompt engineering to umiejętność dobrego pisania tych instrukcji.

Na przykład coś takiego:

“Jesteś profesjonalnym redaktorem. Proszę, sprawdź poniższy tekst.”

Dajesz rozmówcy kontekst i warunki wstępne, żeby wydobyć bardziej specjalistyczne odpowiedzi. Kluczem jest pisanie dobrych instrukcji.

To pozostaje ważne nawet w późniejszych generacjach. Miało jednak fatalną słabość.

Musisz to powtarzać za każdym razem

“Jesteś badaczem śledzenia całego ciała, twoja forma pierwszoosobowa to ‘ja’, twój styl pisania to casualowo-uprzejmy…”

Musisz to pisać za każdym razem, w ograniczonej liczbie znaków.

AI nie może zapamiętać wszystkiego, więc musisz być tak zwięzły, jak to możliwe, ale jednocześnie dokładny.

Szczerze mówiąc, miało to swoje ograniczenia.

Zapomina, gdy rozmowa się wydłuża

Ludzie są tacy sami, prawda? Kiedy rozmawiasz przez dłuższy czas, kończysz myśląc “zaraz, o czym właściwie rozmawialiśmy?” AI jest takie samo.

Jakość staje się niestabilna

W miarę wydłużania się rozmów jakość zaczyna się wahać. Ustawiłeś AI jako “badacza śledzenia całego ciała”, ale w połowie drogi zmienia się w zupełnie inną postać.

Nie możesz wykorzystać wcześniejszej wiedzy

Chciałbyś powiedzieć “proszę, wchłoń wszystkie informacje z artykułów, które napisałem wcześniej i wykorzystaj je”, ale to niemożliwe. Jest limit tego, ile AI może przechowywać w pamięci naraz.

Ostatecznie podejście “próbowania ogarnięcia wszystkiego samymi promptami” zaczęło pokazywać swoje ograniczenia.

Pytanie brzmiało: czy jest inny sposób? I korzystanie z AI ewoluowało w nowym kierunku.

Generacja 2: Context Engineering

Czym jest context engineering? To umiejętność projektowania “jakie informacje pokazać AI, w jakim momencie i w jakiej kolejności.”

Jeśli prompty dotyczą “co zapytać”, to kontekst dotyczy “co pokazać AI.”

Trzy rzeczy do zrobienia

Po pierwsze, nakarm AI niezbędnymi informacjami.

Kiedy AI ma napisać artykuł, wczytujesz wcześniej odpowiednie artykuły z przeszłości, najnowsze informacje o urządzeniach, opinie czytelników itd. Nie wszystko — tylko to, co jest istotne dla bieżącego zadania.

Następnie zarządzaj świeżością informacji.

Oceniasz “ta informacja jest aktualna” i “tamta informacja jest przestarzała”, i priorytetowo pokazujesz nowsze dane. Jeśli każesz AI napisać “najnowsze rekomendacje” na podstawie starych informacji, to będzie mylące.

Na koniec, zaprojektuj kolejność informacji.

Kolejność, w jakiej pokazujesz rzeczy AI, zmienia wynik. “Najpierw pomóż zrozumieć świat VRChat. Potem pomóż zrozumieć technologię śledzenia całego ciała. Na koniec przedstaw bieżący temat.” Odwrócenie tej kolejności daje zupełnie inne rezultaty.

Cztery techniki

Mówi się, że context engineering ma cztery główne techniki.

Selekcja: Wybieranie niezbędnych informacji.

Kompresja: Kondensowanie informacji i przekazywanie tylko kluczowych punktów.

Segmentacja: Dzielenie informacji na bloki i prezentowanie ich etapami.

Usuwanie: Eliminowanie niepotrzebnych informacji w celu redukcji szumu.

Wrzucanie wszystkiego naraz faktycznie przynosi odwrotny skutek. Kluczem do context engineering jest prezentowanie tylko tego, co potrzebne, w formie, w jakiej jest potrzebne.

Generacja 3: Harness Engineering

Ostatnią, która się pojawiła, jest harness engineering.

Kiedy słyszysz “harness” (uprząż), niektórzy mogą pomyśleć o wiązce elektrycznej w samochodzie. Ale uprząż, o której tu mówię, pierwotnie oznacza pełny zestaw wyposażenia do kontrolowania konia. Narzędzia, które kierują konia we właściwym kierunku.

Harness engineering to umiejętność projektowania samego środowiska, w którym AI działa, tak aby zawsze podążało we właściwym kierunku.

Podobieństwa do test harness

Przy okazji, skoro Anthropic — firma, która tworzy Claude Code — jest firmą programistyczną, myślę, że ten “harness” dzieli tę samą etymologię co “test harness.”

Test harness to termin z inżynierii oprogramowania oznaczający system, który strukturalnie kontroluje środowisko wykonawcze testowanego obiektu i sprawia, że wyniki są weryfikowalne.

Sprzęt do prawidłowego prowadzenia konia. System do prawidłowego weryfikowania obiektów testowych. Projektowanie środowiska do prawidłowej pracy AI. Wszystko się łączy.

Co właściwie robię?

Pozwólcie, że przedstawię uprząż, którą faktycznie zbudowałem.

Po pierwsze: Umiejętności (Persony).

Zasady takie jak “Hiro pisze w ten sposób”, “forma pierwszoosobowa to ja”, “to jest zabronione” są zdefiniowane w plikach. AI czyta te pliki i od początku działa z założeniem “jestem Hiro.”

Nie trzeba pisać “jesteś Hiro” w prompcie za każdym razem. AI jest już na właściwych torach.

Po drugie: Baza wiedzy.

Artykuły, które napisałem w przeszłości, wiedza o VRChat, informacje o urządzeniach do śledzenia całego ciała. Wszystko to jest uporządkowane w folderach, a AI może się do tego odwoływać w razie potrzeby.

Nie trzeba pisać “śledzenie całego ciała to technologia, która śledzi ruchy całego ciała…” w prompcie za każdym razem. AI wie, jak szukać i jak znaleźć wiedzę.

Po trzecie: Przepływ pracy.

Istnieje ustalona procedura pisania artykułów: potwierdź temat, zaprojektuj ukryty temat, szkic, pisanie, rewizja. Ta procedura jest zapisana w pliku, więc AI może przechodzić przez “o czym najpierw pomyśleć” krok po kroku.

Po czwarte: Pamięć.

Zapisy takie jak “ta osoba podjęła wcześniej taką decyzję” i “taka polityka została ustalona dla tego projektu” są zapisane w plikach, a AI może je czytać w nowych sesjach.

To może być najważniejszy element. Pamięć przenosi się poza limity okna kontekstowego.

Po piąte: Kontrole jakości (Checkery).

Kiedy AI produkuje wynik, nie trafia on od razu do publikacji. Checker uruchamia się automatycznie. “Czy pasuje do oryginalnej definicji?” “Czy forma pierwszoosobowa jest prawidłowa?” Jeśli coś nie przejdzie, proces wraca na początek schematu i robi to ponownie.

Zamiast mówić “uważaj” w prompcie, kontrole są wbudowane w system.

Różnica między “prośbami” a “systemami”

Ważny punkt: “Ale przecież na etapie context engineering też były definicje warunków typu ‘rób to tak’ i ‘pisz to tak’?”

Tak, były. Ale te definicje warunków były tak naprawdę tylko prośbami.

Nawet jeśli powiedziałeś “nie rób tego” albo “nie pisz tak”, nie było żadnego systemu zapewniającego prawidłową ścieżkę. Ponieważ to były prośby, AI mogło o nich zapomnieć lub je zignorować.

Harness engineering to nie prośba — to struktura. Kładzie tory, po których AI może jechać tylko we właściwym kierunku. To jest fundamentalna różnica.

Porównanie wszystkich trzech obok siebie

Uporządkujmy wszystko do tej pory naraz.

Prompt Engineering:

Umiejętność składania dobrych “zamówień” dla AI.

W terminologii restauracyjnej: Składanie zamówienia.

Context Engineering:

Umiejętność dostarczania AI “właściwych składników.”

W terminologii restauracyjnej: Pozyskiwanie właściwych składników.

Harness Engineering:

Umiejętność projektowania “kuchni”, w której AI pracuje.

W terminologii restauracyjnej: Projektowanie kuchni.

Zupełnie się różnią, prawda? Ale potrzebujesz wszystkich trzech.

Najlepsze zamówienie (prompt) x najlepsze składniki (kontekst) x najlepsza kuchnia (harness).

Kiedy wszystkie trzy się połączą, AI faktycznie potrafi gotować. Jeśli brakuje któregokolwiek, to nie działa.

Analogia z domem jeszcze bardziej to wyjaśnia

Dla tych, którym nie trafiła analogia restauracyjna, oto wersja z domem.

Harness = Fundament. Raz zbudowany, trwa wiecznie.

Kontekst = Ściany i filary (konstrukcja). Można je rekonfigurować w zależności od zadania.

Prompt = Wystrój wnętrz (rozmieszczenie mebli). Można go zmieniać za każdym razem.

Solidny fundament, właściwe ściany i dobrze rozmieszczone wnętrza. Dopiero gdy wszystko się ze sobą łączy, staje się to “domem.”

Odwrotnie, bez względu na to jak wymyślny jest wystrój (prompt), bez fundamentu (harness) odbudujesz wszystko od zera za każdym razem. Bez ścian (kontekst) nie masz nawet pokoju.

Prawdziwy przykład — Jak napisałem “Metaversowego kochanka”

Gdzie najbardziej odczułem różnicę między tymi trzema, to powieść “Metaversowy kochanek”, wszystkie 12 rozdziałów, którą napisałem niedawno.

Co by się stało z samymi promptami?

“Akcja toczy się w VRChat, tematem jest romans w wirtualnym świecie, proszę napisz w 12 rozdziałach.”

Napisz to, popraw wynik, daj więcej instrukcji, popraw ponownie. Powtarzaj.

Coś z tego wychodzi. Ale to, co dostajesz, to “powieść typowa dla AI.” Opisy VRChat są płytkie, a emocje śledzenia całego ciała nie przebijają.

Co zrobiłem

Użyłem wszystkich trzech warstw.

Na poziomie promptu:

“Ten rozdział wygląda mniej więcej tak.” “Ta scena powinna mieć taką atmosferę.” Utrzymywałem indywidualne instrukcje proste.

Na poziomie kontekstu:

Wczytałem treść poprzednich rozdziałów, kulturę VRChat dotyczącą witania nowicjuszy, emocjonalne doświadczenie śledzenia całego ciała i atmosferę sal tanecznych. Informacje, których ten konkretny rozdział potrzebował właśnie teraz.

Na poziomie uprzęży:

Persona “Hiro” zapewniała autentyczność VRChat. Baza wiedzy zapewniała dokładne opisy śledzenia całego ciała. Kontrole jakości potwierdzały “Czy jest coś nierealnego dla VRChat?” i “Czy historia jest spójna?” Pamięć utrzymywała konsystencję we wszystkich 12 rozdziałach.

Najtrudniejszy był, szczerze mówiąc, kontekst. Jeśli nie potrafisz czegoś sam wyrazić słowami, nie możesz tego przekazać AI. Wyrażanie “tego szczególnego uczucia VRChat” jest naprawdę trudne. Było wiele porażek.

Ale kiedy wszystkie trzy kliknęły razem, byłem w stanie napisać 12-rozdziałowe dzieło o konsystentnej jakości. Gdyby brakowało jakiegokolwiek pojedynczego elementu, nie sądzę, żeby to się udało.

Te trzy nie są w opozycji — to warstwy

“Czyli prompt engineering jest teraz przestarzały?”

Absolutnie nie.

Wyjaśniłem, że te trzy należą do różnych generacji, ale to nie znaczy, że starsze stają się zbędne. Używasz wszystkich. To po prostu różne warstwy.

Nawet po zbudowaniu uprzęży nadal dajesz instrukcje na poziomie promptu: “Napisz ten rozdział tak.”

Nawet jeśli kontekst jest dobrze zorganizowany, niechlujny prompt da niechlujny wynik.

Dopiero gdy wszystkie trzy się połączą, AI działa na pełnych obrotach.

Podsumowanie

Samymi promptami jesteś klientem składającym zamówienia od zera za każdym razem.

Kiedy uporządkujesz kontekst, AI dostaje dobre składniki, a jakość wyniku gwałtownie rośnie.

Kiedy zbudujesz uprząż, AI staje się członkiem zespołu. Nosi twoją wiedzę, pracuje w twoim stylu i działa w twoim imieniu.

Jestem badaczem śledzenia całego ciała, ale jest tak samo ze śledzeniem całego ciała.

Z samym headsetem i kontrolerami (= tylko prompty) możesz wejść do wirtualnego świata.

Wybór odpowiedniego świata (= uporządkowanie kontekstu) zmienia jakość doświadczenia.

Założenie czujników śledzenia całego ciała, kalibracja i przygotowanie środowiska (= budowanie uprzęży) — dopiero wtedy po raz pierwszy dostajesz uczucie “bycia tam osobiście.”

Z AI jest tak samo.

Dopiero gdy wyrównasz wszystkie trzy warstwy, staje się to “twoim AI.”

Mam nadzieję, że wszyscy spróbujecie etapów, które leżą poza promptami.

Hiro

Dziękujemy za przeczytanie! Obserwuj nas na X i subskrybuj nasz kanał YouTube!

Nadal tkwisz na etapie “bycia dobrym w promptach”? — Ewolucja AI i trzy rodzaje inżynierii

検索

Istnieją trzy generacje korzystania z AI

Generacja 1: Prompt Engineering

Musisz to powtarzać za każdym razem

Zapomina, gdy rozmowa się wydłuża

Jakość staje się niestabilna

Nie możesz wykorzystać wcześniejszej wiedzy

Generacja 2: Context Engineering

Trzy rzeczy do zrobienia

Cztery techniki

Generacja 3: Harness Engineering

Podobieństwa do test harness

Co właściwie robię?

Różnica między “prośbami” a “systemami”

Porównanie wszystkich trzech obok siebie

Analogia z domem jeszcze bardziej to wyjaśnia

Prawdziwy przykład — Jak napisałem “Metaversowego kochanka”

Co by się stało z samymi promptami?

Co zrobiłem

Te trzy nie są w opozycji — to warstwy

Podsumowanie

関連

Istnieją trzy generacje korzystania z AI

Generacja 1: Prompt Engineering

Musisz to powtarzać za każdym razem

Zapomina, gdy rozmowa się wydłuża

Jakość staje się niestabilna

Nie możesz wykorzystać wcześniejszej wiedzy

Generacja 2: Context Engineering

Trzy rzeczy do zrobienia

Cztery techniki

Generacja 3: Harness Engineering

Podobieństwa do test harness

Co właściwie robię?

Różnica między “prośbami” a “systemami”

Porównanie wszystkich trzech obok siebie

Analogia z domem jeszcze bardziej to wyjaśnia

Prawdziwy przykład — Jak napisałem “Metaversowego kochanka”

Co by się stało z samymi promptami?

Co zrobiłem

Te trzy nie są w opozycji — to warstwy

Podsumowanie

シェア＆RTお願いします！

関連