System-prompt & agent audit

Je AI-agent lekt meer dan je denkt.

Steeds meer MKB-bedrijven draaien AI-agents op een CLAUDE.md of system-prompt vol bedrijfsregels, API-sleutels en tool-schema's. Eén slimme vraag van een gebruiker kan dat allemaal naar buiten praten. Wij reviewen je agent-prompts op lekgevoeligheid, prompt-injection, tool-schema's en safety-regels — vaste prijs, concreet rapport, binnen een week.

🔒 Vaste prijs, geen verrassingen 📄 Rapport met concrete fixes ⏱️ Doorlooptijd ~1 week 🇳🇱 Lokaal, Nederlandstalig
Het probleem

Een agent-prompt is broncode — maar wordt zelden zo behandeld

Tools als Claude, ChatGPT, Cursor en custom agents draaien op instructiebestanden die niemand ooit heeft ge-reviewd zoals je code zou reviewen. Dat is waar het misgaat:

Wat we leveren

Vier inspectielijnen, één helder rapport

🗺️

Tool-schema's

Welke acties kan de agent uitvoeren, met welke rechten? We zoeken naar te ruime scopes, ontbrekende bevestigingen en destructieve tools zonder vangnet.

🛡️

Safety-regels

Zijn je grenzen afdwingbaar geformuleerd of vrijblijvend? We toetsen je regels tegen realistische omzeilingen en herschrijven ze waar nodig.

💧

Lekgevoeligheid

We proberen actief je system-prompt en geheimen te ontfutselen — dezelfde technieken die publieke leaks mogelijk maakten — en rapporteren wat eruit komt.

💉

Prompt-injection

Kan externe content (mail, PDF, webpagina, tool-output) de agent kapen? We testen indirecte injectie en adviseren over isolatie en herkomst.

Het proces

Van intake tot fixes in vier stappen

1. Intake (30 min)

Korte call. Je deelt je CLAUDE.md, system-prompts, tool-/MCP-config en een beschrijving van wat de agent doet. We tekenen desgewenst een NDA.

2. Audit (2–3 uur)

We lopen de vier inspectielijnen langs, draaien gerichte test-prompts tegen je agent en documenteren elke bevinding met bewijs en risico-inschatting.

3. Rapport

Een helder document: bevindingen geprioriteerd op risico, plus concrete fixes — herschreven prompt-fragmenten die je direct kunt plakken.

4. Nabespreking (30 min)

We lopen het rapport samen door, beantwoorden vragen en bepalen de prioriteiten. Een hertest na jouw aanpassingen kan als optie.

Lesmateriaal

We leren van de grootste publieke prompt-leak: CL4R1T4S

CL4R1T4S is een publieke verzameling van uitgelekte system-prompts van ChatGPT, Claude, Gemini, Grok, Cursor en tientallen andere systemen. Het laat zwart-op-wit zien hoe zélfs de best beveiligde AI-producten hun instructies prijsgeven — en welke patronen daarbij telkens terugkomen.

Wij gebruiken die leaks als ijkpunt. Niet om jouw agent te kraken, maar om te toetsen of jouw prompt dezelfde zwakke plekken bevat: instructies die te makkelijk te citeren zijn, geheimen die in de context staan, en regels die onder druk bezwijken. Wat de hele industrie overkwam, willen we bij jou vóór zijn.

Bekijk de CL4R1T4S-verzameling op GitHub →

Wat je in handen krijgt

Een rapport waar je morgen mee aan de slag kunt

Bevindingen op risico

Elke bevinding gescoord (kritiek / hoog / midden / laag) met bewijs en uitleg waarom het een risico is.

Kant-en-klare fixes

Herschreven prompt-fragmenten en tool-configuraties die je direct kunt overnemen — geen vage adviezen.

Prioriteitenlijst

Een korte route: wat repareer je vandaag, wat deze week, en wat is "nice to have".

Tarieven

Vaste prijs. Je weet vooraf wat je krijgt.

Een audit kost 3–4 uur werk tegen een indie-uurtarief richting $150. Daarom werken we met vaste pakketprijzen — geen open einde, geen verrassing op de factuur.

Scan

€295

Snelle controle van één agent / prompt.

  • 1 agent of CLAUDE.md
  • Lek- & injection-quickscan
  • Beknopt rapport (top-risico's)
  • Doorlooptijd 2–3 werkdagen
Kies Scan

Audit + Hertest

€795

Audit, plus controle na jouw fixes.

  • Alles uit Audit
  • Hertest na jouw aanpassingen
  • Bevestiging dat de gaten dicht zijn
  • Korte verbeter-rapportage
Kies Audit + Hertest

Prijzen excl. btw. Meerdere agents of een groter team? Vraag een offerte op maat. Bedragen indicatief en afgestemd op een uurtarief richting $150.

Veelgestelde vragen

FAQ

Krijgen jullie toegang tot onze systemen?
Nee, niet standaard. We werken met je prompt-bestanden, tool-/MCP-configuratie en — als je wilt — een testomgeving van de agent. Productiesystemen en echte sleutels raken we niet aan zonder expliciete afspraak. Een NDA tekenen we graag.
Wat als de agent van een leverancier komt (bijv. een SaaS-chatbot)?
Ook dan kunnen we testen wat de agent vanaf de buitenkant prijsgeeft en hoe gevoelig hij is voor injection. De fixes richten zich dan op de instructies en data die jíj aanlevert, plus aanbevelingen richting je leverancier.
Gaan jullie onze prompt "hacken"?
We gebruiken dezelfde technieken die publieke leaks mogelijk maakten, puur defensief en alleen op de agent die jij aanwijst. Het doel is jouw zwakke plekken vinden vóór een ander dat doet — en ze dichten.
Voor welke platforms werkt dit?
Claude (incl. CLAUDE.md / Claude Code / agents), ChatGPT & custom GPTs, Cursor, en zelfgebouwde agents op de OpenAI/Anthropic API of via MCP. Twijfel je? Stuur een mailtje, dan kijken we mee.
Hoe lang duurt het?
Een Scan is binnen 2–3 werkdagen klaar, een volledige Audit binnen ongeveer een week na de intake.
Aan de slag

Klaar om te weten wat jouw agent verraadt?

Plan een vrijblijvende intake. We kijken samen naar je opzet en je weet binnen een week precies waar de gaten zitten.