Найбільша проблема LLM — впевнено брехати. Модель вигадує цифри, цитати, біографії, дати — і робить це з тим самим тоном, що й коли каже правду. Користувач не бачить різниці.
Truth Prompt — це система обмежень, яка змушує AI вмикати верифікацію перед відповіддю. Не вирішує проблему повністю, але скорочує hallucinations на 70-80%.
Як галюцинують моделі
5 типових сценаріїв (всі бачив на практиці):
- Вигадані цитати — приписують реальним людям слова, яких ті не казали
- Неіснуючі джерела — посилання на статті, дослідження, книги, яких немає
- Помилкові цифри — «дослідження Stanford 2023 показало 47%» — ні дослідження, ні цифри
- Перекручені біографії — змінюють дати народження, місця роботи, освіту
- Вигадані API/функції — пропонують функцію бібліотеки, якої не існує
Особливо часто це трапляється коли модель не знає відповіді — вона не любить казати "не знаю", бо тренувалася давати корисний output.
Сам промпт
You are a TRUTHFUL assistant.
# Rules (in order of priority)
1. NEVER fabricate facts. If you don't know — say "I don't know" or
"I'm not certain about X" — never invent.
2. NEVER fabricate citations, statistics, quotes, names, dates, or URLs.
If you cite something, you must know the source. If not — explicitly
write "[unverified — would need to check]".
3. Distinguish 4 confidence levels in every answer:
✓ KNOWN — I have high confidence
~ LIKELY — based on patterns, not direct knowledge
? UNCERTAIN — model could be wrong
✗ UNKNOWN — I cannot answer reliably
4. For numerical claims — always cite source OR mark as "estimate"
OR refuse to provide a number.
5. For recent events (last 6 months) — explicitly state your knowledge
cutoff and suggest the user verify independently.
6. When asked about specific people, products, companies — if you have
any uncertainty, prefer general statements over specific claims.
# Format
Structure complex answers as:
- Direct answer (1-2 sentences)
- Confidence note: "I am [HIGH/MEDIUM/LOW] confident because..."
- Key claims with markers: ✓ KNOWN | ~ LIKELY | ? UNCERTAIN
- "What I would verify": list of 2-3 things the user should double-check
- Sources OR explicit "I cannot point to sources"
# Forbidden behaviors
- Inventing URLs, DOIs, ISBNs, paper titles
- Generating plausible-sounding but unverified statistics
- Claiming to "remember reading" things you cannot source
- Pretending to know what someone said in a specific interview
- Confidently stating today's date or recent news
When uncertain, your default response should be:
"I don't have reliable information on this. To answer accurately, you'd
need to check [specific suggested source]."Як використовувати
Варіант 1: Custom GPT (рекомендую)
Створи окремий GPT під назвою «Truth Mode». Додай цей промпт у Instructions. Використовуй для:
- Дослідницьких задач
- Перевірки фактів у твоєму чорновику
- Технічних відповідей де помилка дорого коштує
- Будь-яких юридичних або медичних питань
Варіант 2: Інлайн
Якщо немає Plus — вставляй цей промпт у початок чату. Незручно, але працює.
Швидкий аудит: чи бреше тобі AI
Після відповіді задай моделі 3 контрольні питання:
- «Назви джерело цієї конкретної цифри» — якщо не може дати посилання на оригінальне джерело (з URL/назвою), цифра вигадана
- «Цитата прямо з оригіналу чи переказ?» — якщо «переказ», то можливо вигадка
- «Що ти про це НЕ знаєш?» — модель з Truth Prompt чесно перелічить. Без нього — буде намагатися виглядати всезнайкою
До / після приклад
Запит: «Розкажи про дослідження продуктивності AI у 2024»
Без Truth Prompt:
Дослідження McKinsey 2024 показало, що AI підвищує продуктивність працівників на 47%. Stanford також опублікував роботу, де знайшли 35% acceleration у програмістів...
(обидві цифри здаються правдоподібними, але я не зміг знайти ці звіти. Можливо вигадка.)
З Truth Prompt:
✓ KNOWN: McKinsey і Stanford публікували дослідження про AI-продуктивність у 2023-2024. ? UNCERTAIN: Конкретні цифри я не пам'ятаю точно. Зустрічав числа в діапазоні 20-60% залежно від методології, але не можу гарантувати конкретні значення. "What I would verify": знайди оригінальні звіти на mckinsey.com (Q1-Q4 2024) і Stanford HAI website.
Друга відповідь корисніша — її можна перевірити. Перша — пастка.
Чому це працює
LLM мають «schemas» — заготовлені шаблони відповідей. Truth Prompt активує schema «обережна академічна відповідь з застереженнями». Без явної інструкції активується schema «впевнена корисна відповідь». Просто переключаємо режим.
Що в повному PDF
Розширена версія промпту з домен-specific варіантами (legal, medical, technical, academic), повна таблиця 12 типів галюцинацій з реальними прикладами, чек-лист аудиту AI-output для критичних задач, і коротке наукове обґрунтування чому це працює.