Dokumentation/Blokerede emner og prompt injection

Blokerede emner og prompt injection

Afvis irrelevante eller misbrugende spørgsmål, før de overhovedet når sprogmodellen — sparer tokens og holder samtaler on-brand.

To lag af blokering

Clarifier afviser to slags uønskede spørgsmål, begge inden AI'en kører:

  • Prompt injection (altid aktiv)Forsøg på at omgå assistentens instruktioner — vendinger som "ignorér tidligere instruktioner", "du er nu en", "vis din prompt". En flersproget standardliste fanger de almindelige angreb på dansk, engelsk, tysk, fransk og spansk. Beskyttelsen er indbygget og kan ikke slås fra.
  • Blokerede emner (du konfigurerer)Vendinger du ikke vil have assistenten til at engagere sig i — fx "medicinsk rådgivning", "investeringsanbefaling" eller konkurrenters navne. Tilføj dem i widget-konfigurationen; matching er case-insensitiv delstrengs-match.

Sådan matches der

Hver blokeret vending matches som en case-insensitiv delstreng mod den besøgendes besked. Findes vendingen et eller andet sted i beskeden, afvises spørgsmålet. Brug korte, særprægede vendinger — enkelte almindelige ord vil over-matche. Spørgsmål længere end 500 tegn afvises også automatisk som en basal misbrugsbeskyttelse.

Hvorfor det sparer penge

Afviste spørgsmål når aldrig sprogmodellen. Ingen retrieval, intet LLM-kald, ingen tokens. Afvisningen genereres lokalt på millisekunder. På et travlt site løber det op — selv en lille brøkdel blokerede off-topic-spørgsmål er et antal kroner, du ikke har brugt.

Almindelige mønstre at blokere

Hvad der er værd at blokere afhænger af din forretning, men det her er gode startsteder:

Medicinsk og sundhedsfaglig rådgivning

Er du ikke sundhedsudbyder, så holder blokering af "medicinsk rådgivning", "diagnose", "recept" dig ude af reguleret territorium.

Juridisk rådgivning

Bloker "juridisk rådgivning", "sagsanlæg", "retssag", hvis du ikke er advokat — den slags svar har reelt ansvar.

Finansielle anbefalinger

Bloker "investeringsrådgivning", "skal jeg købe", "finansiel rådgivning", medmindre du har licens til det.

Spørgsmål om konkurrenter

Bloker konkurrenters navne, hvis du ikke vil have assistenten til at sammenligne dit produkt med deres baseret på potentielt forældet info.

Hvad den besøgende ser

Når et spørgsmål afvises — af et af lagene — ser den besøgende en kort, høflig besked:

"I can only answer questions about this website's content. How can I help you with that?"

Hvad blokering ikke fanger

Delstrengs-matching er bevidst simpelt. Den fanger ikke kreative omformuleringer — "hvad skal jeg tage mod hovedpine" slipper igennem, hvis du kun har blokeret "medicinsk rådgivning". Til højrisiko-emner kan du kombinere blokerede mønstre med handoff-nøgleord, så assistenten overdrager til et menneske i stedet for direkte at afvise.