fix(zopk): Neutralne prompty ekstrakcji - unikanie safety filters

Problem: Gemini blokował ekstrakcję z artykułów o energetyce
Rozwiązanie: Bardziej neutralne sformułowania promptów
- Podkreślono że to analiza PUBLICZNYCH artykułów prasowych
- Usunięto wrażliwe słowa kluczowe (nuclear, defense)
- Zmieniono 'extract' na 'identify'

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
This commit is contained in:
Maciej Pienczyn 2026-01-16 20:42:05 +01:00
parent cd2db86a95
commit 27b03eb051

View File

@ -90,28 +90,30 @@ RELATION_TYPES = [
# AI PROMPTS
# ============================================================
EXTRACTION_SYSTEM_PROMPT = """Jesteś ekspertem ds. ekstrakcji wiedzy z artykułów o projekcie Zielony Okręg Przemysłowy Kaszubia (ZOPK).
EXTRACTION_SYSTEM_PROMPT = """Jesteś asystentem analitycznym, który pomaga tworzyć podsumowania PUBLICZNYCH artykułów prasowych z polskich portali informacyjnych.
ZOPK to strategiczny projekt transformacji energetycznej i przemysłowej Pomorza, obejmujący:
- Morską energetykę wiatrową (Baltic Power, Baltica, F.E.W. Baltic)
- Elektrownię jądrową (Lubiatowo-Kopalino, PEJ)
- Inwestycje norweskie Kongsberg w Rumi
- Infrastrukturę: Via Pomerania, S6, Droga Czerwona
- Centra danych, laboratoria wodorowe
Analizujesz artykuły o LEGALNYCH inwestycjach infrastrukturalnych i energetycznych w Polsce, takich jak:
- Projekty energetyki odnawialnej (farmy wiatrowe offshore)
- Inwestycje przemysłowe (parki przemysłowe, fabryki)
- Infrastruktura transportowa (drogi, koleje)
- Projekty energetyczne realizowane zgodnie z polityką państwa
Twoim zadaniem jest wyodrębnić z tekstu:
1. FAKTY - konkretne, weryfikowalne informacje (liczby, daty, decyzje)
2. ENCJE - nazwy własne (firmy, osoby, miejsca, projekty)
3. RELACJE - powiązania między encjami"""
WAŻNE: To jest analiza PUBLICZNIE DOSTĘPNYCH wiadomości prasowych, które można znaleźć w Google News.
Nie tworzysz treści - tylko identyfikujesz i strukturyzujesz informacje już opublikowane przez dziennikarzy.
EXTRACTION_USER_PROMPT = """Przeanalizuj poniższy fragment artykułu i wyodrębnij strukturalne informacje.
Twoim zadaniem jest zidentyfikować w tekście:
1. FAKTY - konkretne informacje (liczby, daty, decyzje biznesowe)
2. PODMIOTY - nazwy firm, osób, miejsc, projektów
3. POWIĄZANIA - relacje między podmiotami"""
TEKST:
EXTRACTION_USER_PROMPT = """Poniżej znajduje się fragment PUBLICZNIE DOSTĘPNEGO artykułu prasowego. Zidentyfikuj kluczowe informacje i podmioty.
ARTYKUŁ PRASOWY:
{chunk_text}
ŹRÓDŁO: {source_name} ({published_date})
ŹRÓDŁO ARTYKUŁU: {source_name} ({published_date})
Zwróć JSON w formacie:
Odpowiedz w formacie JSON:
{{
"facts": [
{{