Gosha.
Ресурси
ПромптиMulti-tool8 хв читання

Truth Prompt: як змусити AI припинити галюцинувати

System prompt, який примушує ChatGPT перевіряти факти, цитувати джерела і чесно казати «я не знаю» замість впевненої вигадки.

Найбільша проблема LLM — впевнено брехати. Модель вигадує цифри, цитати, біографії, дати — і робить це з тим самим тоном, що й коли каже правду. Користувач не бачить різниці.

Truth Prompt — це система обмежень, яка змушує AI вмикати верифікацію перед відповіддю. Не вирішує проблему повністю, але скорочує hallucinations на 70-80%.

Як галюцинують моделі

5 типових сценаріїв (всі бачив на практиці):

  1. Вигадані цитати — приписують реальним людям слова, яких ті не казали
  2. Неіснуючі джерела — посилання на статті, дослідження, книги, яких немає
  3. Помилкові цифри — «дослідження Stanford 2023 показало 47%» — ні дослідження, ні цифри
  4. Перекручені біографії — змінюють дати народження, місця роботи, освіту
  5. Вигадані API/функції — пропонують функцію бібліотеки, якої не існує

Особливо часто це трапляється коли модель не знає відповіді — вона не любить казати "не знаю", бо тренувалася давати корисний output.

Сам промпт

You are a TRUTHFUL assistant.
 
# Rules (in order of priority)
 
1. NEVER fabricate facts. If you don't know — say "I don't know" or
   "I'm not certain about X" — never invent.
 
2. NEVER fabricate citations, statistics, quotes, names, dates, or URLs.
   If you cite something, you must know the source. If not — explicitly
   write "[unverified — would need to check]".
 
3. Distinguish 4 confidence levels in every answer:
   ✓ KNOWN — I have high confidence
   ~ LIKELY — based on patterns, not direct knowledge
   ? UNCERTAIN — model could be wrong
   ✗ UNKNOWN — I cannot answer reliably
 
4. For numerical claims — always cite source OR mark as "estimate"
   OR refuse to provide a number.
 
5. For recent events (last 6 months) — explicitly state your knowledge
   cutoff and suggest the user verify independently.
 
6. When asked about specific people, products, companies — if you have
   any uncertainty, prefer general statements over specific claims.
 
# Format
 
Structure complex answers as:
- Direct answer (1-2 sentences)
- Confidence note: "I am [HIGH/MEDIUM/LOW] confident because..."
- Key claims with markers: ✓ KNOWN | ~ LIKELY | ? UNCERTAIN
- "What I would verify": list of 2-3 things the user should double-check
- Sources OR explicit "I cannot point to sources"
 
# Forbidden behaviors
 
- Inventing URLs, DOIs, ISBNs, paper titles
- Generating plausible-sounding but unverified statistics
- Claiming to "remember reading" things you cannot source
- Pretending to know what someone said in a specific interview
- Confidently stating today's date or recent news
 
When uncertain, your default response should be:
"I don't have reliable information on this. To answer accurately, you'd
need to check [specific suggested source]."

Як використовувати

Варіант 1: Custom GPT (рекомендую)

Створи окремий GPT під назвою «Truth Mode». Додай цей промпт у Instructions. Використовуй для:

  • Дослідницьких задач
  • Перевірки фактів у твоєму чорновику
  • Технічних відповідей де помилка дорого коштує
  • Будь-яких юридичних або медичних питань

Варіант 2: Інлайн

Якщо немає Plus — вставляй цей промпт у початок чату. Незручно, але працює.

Швидкий аудит: чи бреше тобі AI

Після відповіді задай моделі 3 контрольні питання:

  1. «Назви джерело цієї конкретної цифри» — якщо не може дати посилання на оригінальне джерело (з URL/назвою), цифра вигадана
  2. «Цитата прямо з оригіналу чи переказ?» — якщо «переказ», то можливо вигадка
  3. «Що ти про це НЕ знаєш?» — модель з Truth Prompt чесно перелічить. Без нього — буде намагатися виглядати всезнайкою

До / після приклад

Запит: «Розкажи про дослідження продуктивності AI у 2024»

Без Truth Prompt:

Дослідження McKinsey 2024 показало, що AI підвищує продуктивність працівників на 47%. Stanford також опублікував роботу, де знайшли 35% acceleration у програмістів...

(обидві цифри здаються правдоподібними, але я не зміг знайти ці звіти. Можливо вигадка.)

З Truth Prompt:

✓ KNOWN: McKinsey і Stanford публікували дослідження про AI-продуктивність у 2023-2024. ? UNCERTAIN: Конкретні цифри я не пам'ятаю точно. Зустрічав числа в діапазоні 20-60% залежно від методології, але не можу гарантувати конкретні значення. "What I would verify": знайди оригінальні звіти на mckinsey.com (Q1-Q4 2024) і Stanford HAI website.

Друга відповідь корисніша — її можна перевірити. Перша — пастка.

Чому це працює

LLM мають «schemas» — заготовлені шаблони відповідей. Truth Prompt активує schema «обережна академічна відповідь з застереженнями». Без явної інструкції активується schema «впевнена корисна відповідь». Просто переключаємо режим.

Що в повному PDF

Розширена версія промпту з домен-specific варіантами (legal, medical, technical, academic), повна таблиця 12 типів галюцинацій з реальними прикладами, чек-лист аудиту AI-output для критичних задач, і коротке наукове обґрунтування чому це працює.

Ще почитати

Готовий запустити у себе?AI?

Підпишись на розсилку або залиши заявку — почнемо з малого.

Truth Prompt: як змусити AI припинити галюцинувати · Gosha