Provenance Manifesto
arrow_back Powrót do dziennika

From RAG to Provenance (Part 2): Jak inkrementalna pamięć grafowa naprawdę się uczy

Yauheni Kurbayeu

From RAG to Provenance (Part 2): How Incremental Graph Memory Actually Learns

From RAG to Provenance (Part 2): Jak inkrementalna pamięć grafowa naprawdę się uczy

Author: Yauheni Kurbayeu
Published: February 28, 2026 LinkedIn


W poprzednim artykule opisałem moment, w którym zdaliśmy sobie sprawę, że sama wyszukiwarka wektorowa nie jest pamięcią.

Embeddingi świetnie nadają się do znajdowania podobnych tekstów. Ale podobieństwo to nie jest linia pochodzenia decyzji. Nie mówi nam:

  • kto podjął jaką decyzję,
  • na podstawie jakiego założenia,
  • z kim ta decyzja była w konflikcie,
  • i kiedy została zastąpiona inną.

Tym razem chcę pokazać, co dzieje się dalej.

Jak system faktycznie aktualizuje pamięć organizacyjną w sposób inkrementalny?

Nie w teorii. Nie na diagramach architektury.
Tylko krok po kroku — na prostym przykładzie z życia.


Step 0 — Wejście (gdzie zaczyna się pamięć)

Załóżmy, że taka notatka pojawia się po spotkaniu produktowym:

„Yauheni zdecydował o przesunięciu wydania instancji EU, ponieważ nowa interpretacja GDPR od zespołu prawnego wprowadza dodatkowe ryzyka zgodności. Action item: przygotować plan mitigacji z zespołem bezpieczeństwa. Anton zadał pytanie, czy możemy izolować dane per workspace zamiast per region.”

To jest tylko tekst.

Ale w tym jednym akapicie znajdują się:

  • Decyzje
  • Ryzyka
  • Pytania
  • Zadania (action items)
  • Osoby
  • Niejawne zależności

Cel biznesowy jest prosty:

Nie pozwól, aby to zniknęło w historii Slacka. Zamień to w uporządkowaną i możliwą do prześledzenia pamięć organizacyjną.

Zaangażowani aktorzy

  • Product lead (autor źródła)
  • Legal (niejawny autorytet)
  • Zespół bezpieczeństwa
  • System Provenance (AI + pamięć grafowa)
  • Ludzki recenzent

Step 1 — Scribing: przekształcanie tekstu w strukturę znaczeń

Cel biznesowy: wyodrębnić jawne artefakty, aby mogły być zarządzane.

System odczytuje tekst i przekształca go w obiekty strukturalne.

Output (uproszczony przykład JSON):

{
  "artifacts": [
    {
      "type": "Decision",
      "title": "Postpone EU Instance Release",
      "reason": "New GDPR clarification introduces compliance risks",
      "owner": "Yauheni"
    },
    {
      "type": "Risk",
      "title": "Additional GDPR compliance exposure",
      "source": "Legal clarification"
    },
    {
      "type": "ActionItem",
      "title": "Prepare mitigation plan with security team"
    },
    {
      "type": "Question",
      "title": "Can we isolate data per workspace instead of per region?",
      "raised_by": "Anton"
    }
  ]
}

To jeszcze nie jest pamięć. To interpretacja w trybie staging.

Na tym etapie nic nie jest jeszcze zapisane w głównym grafie.


Step 2 — Budowa małego grafu tymczasowego

Cel biznesowy: przedstawić logikę tej jednej notatki zanim zostanie połączona z globalną pamięcią.

Na podstawie wyodrębnionych artefaktów system buduje mały tymczasowy graf.

Small Staged Graph

Powstała struktura logiczna:

Decision → depends_on → Risk
ActionItem → mitigates → Risk
Question → references → Decision

Ten graf istnieje tylko w obrębie bieżącej transakcji.
Nie jest jeszcze częścią trwałej pamięci organizacji.

Dlaczego?

Ponieważ jeszcze nie wiemy:

  • czy to ryzyko już istnieje,
  • czy decyzja jest kontynuacją wcześniejszej,
  • czy ktoś o wyższym autorytecie wcześniej nie podjął innej decyzji.

Step 3 — Porównanie semantyczne (ale nie w ciemno)

Cel biznesowy: wykryć, czy te obiekty już istnieją w pamięci.

System sprawdza podobieństwo semantyczne w stosunku do istniejącej pamięci.

Załóżmy, że znajduje:

Similarity Table

Teraz system staje przed pytaniem biznesowym:

  • Czy to są te same rzeczy?
  • Czy są tylko powiązane, ale jednak różne?

Same wektory nie potrafią na to odpowiedzieć.

Dlatego system pobiera kontekst z grafu:

  • kto był właścicielem wcześniejszej decyzji,
  • jaki był powód,
  • czy była tymczasowa,
  • czy została później zastąpiona.

Tutaj właśnie pamięć grafowa ma znaczenie.


Step 4 — Rozstrzyganie tożsamości (scalić czy utworzyć?)

Cel biznesowy: uniknąć duplikacji bez utraty niuansów.

System ocenia:

  • wcześniejsze „Delay EU rollout (Q1)” wynikało z niestabilności infrastruktury,
  • nowe opóźnienie wynika z ryzyka prawnego.

Inny powód. Inny zakres. Inny moment.

Decyzja:

  • ✔ utworzyć nowy węzeł Decision
  • ✔ połączyć go z istniejącym węzłem ryzyka GDPR

Jeśli ryzyko już istnieje, nie duplikujemy go.
Wzmacniamy je.

Pamięć staje się warstwowa, a nie fragmentaryczna.


Step 5 — Ocena i ważenie relacji

Cel biznesowy: określić siłę zależności.

Nie wszystkie zależności są takie same.

Przykład:

  • Decision depends_on Risk → silne powiązanie przyczynowe
  • Question references Decision → słabsze powiązanie kontekstowe

Każda krawędź otrzymuje:

  • fragment dowodu
  • poziom pewności
  • referencję źródła
  • identyfikator transakcji

Przykładowy zapis:

{
  "from": "Decision: Postpone EU Instance Release",
  "to": "Risk: GDPR data residency risk",
  "type": "depends_on",
  "weight": 0.82,
  "evidence": "because the new GDPR clarification introduces additional compliance risks",
  "source": "Product Sync 2026-02-27"
}

Teraz system może odpowiedzieć:

  • Dlaczego wydanie zostało przesunięte?
  • Jakie ryzyka to uzasadniały?
  • Jak silne było uzasadnienie decyzji?

Step 6 — Wykrywanie konfliktów (autorytet ma znaczenie)

Wyobraźmy sobie teraz coś istotnego.

Dwa miesiące wcześniej CTO formalnie zdecydował:

“EU instance must go live before Q2 to support enterprise pipeline.”

Wyższy autorytet. Przeciwny kierunek.

System wykrywa:

  • ten sam zakres (instancja EU),
  • sprzeczną decyzję,
  • inny poziom właściciela.

Zgłasza:

⚠ Konflikt: istnieje decyzja wyższego autorytetu.

Na tym etapie system nie blokuje rzeczywistości.

Prosi o walidację człowieka.

To jest governance, nie automatyzacja.


Step 7 — Przegląd człowieka (warstwa zaufania)

Cel biznesowy: zachować odpowiedzialność.

Recenzent widzi zestaw zmian.

Tworzy:

  • nową Decision
  • nowe ActionItem

Scala:

  • Risk → istniejące ryzyko GDPR

Relacje:

  • Decision depends_on Risk
  • ActionItem mitigates Risk

Konflikt:

  • wcześniejsza dyrektywa CTO wymaga przeglądu

Recenzent może:

  • zatwierdzić
  • zmodyfikować
  • eskalować
  • jawnie zastąpić wcześniejszą decyzję

Jeśli zostanie zastąpiona:

Decision A → supersedes → Decision B

Bez usuwania. Bez przepisywania historii.
Tylko ewolucja.


Step 8 — Commit (atomowa aktualizacja pamięci)

Po zatwierdzeniu system zapisuje wszystko jako jedną transakcję.

Kanoniczny graf zawiera teraz:

Graph

  • Decision (Postpone EU Release)
  • Risk (GDPR Data Residency)
  • Action Item (Mitigation Plan)
  • Question (Data Isolation Strategy)
  • Supersedes / konflikty (jeśli występują)

Każdy element zapisuje:

  • kto go wprowadził
  • kiedy
  • na podstawie jakiego tekstu
  • powiązane wcześniejsze artefakty
  • czy nadpisał wcześniejszą decyzję

To jest pamięć.


Dlaczego to ważne poza architekturą

Spójrzmy z dystansu.

W większości organizacji:

  • decyzje są rozproszone
  • uzasadnienia znikają
  • odpowiedzialność się zmienia
  • kontekst zanika
  • ludzie dyskutują o historii zamiast rozwiązywać problem.

Dzięki inkrementalnym aktualizacjom provenance:

  • każda notatka staje się elementem governance
  • każda zależność staje się jawna
  • każdy konflikt staje się widoczny
  • każda zmiana jest możliwa do prześledzenia

To nie jest RAG.
To nie jest tylko podobieństwo wektorowe.

To jest akumulacja kapitału decyzyjnego.


Większa zmiana

Kiedy 50–80% pracy wykonują agenci AI zamiast inżynierów, staje się to jeszcze ważniejsze.

Agenci będą:

  • generować plany
  • proponować decyzje
  • tworzyć action items
  • refaktoryzować systemy
  • zmieniać architekturę

Bez uporządkowanej pamięci: zwiększają entropię.

Z Provenance: działają w ramach governance.

Różnica nie polega na produktywności.

Różnica polega na przetrwaniu systemu.


Od retrieval do ewolucji

RAG odpowiada na pytania o przeszłość.

Provenance buduje przeszłość inkrementalnie.

Każde przetworzenie:

  1. wyodrębnia znaczenie
  2. rozwiązuje tożsamość
  3. weryfikuje autorytet
  4. zapisuje linię pochodzenia
  5. wzmacnia lub aktualizuje wcześniejszą pamięć

Z czasem graf staje się:

  • historią decyzji
  • mapą ryzyk
  • rejestrem governance
  • żywą pamięcią SDLC

I dzieje się to inkrementalnie.

Jedna notatka ze spotkania na raz.