From 27b03eb0512be36314d507371e84f0a982dbc22b Mon Sep 17 00:00:00 2001 From: Maciej Pienczyn Date: Fri, 16 Jan 2026 20:42:05 +0100 Subject: [PATCH] fix(zopk): Neutralne prompty ekstrakcji - unikanie safety filters MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Problem: Gemini blokował ekstrakcję z artykułów o energetyce Rozwiązanie: Bardziej neutralne sformułowania promptów - Podkreślono że to analiza PUBLICZNYCH artykułów prasowych - Usunięto wrażliwe słowa kluczowe (nuclear, defense) - Zmieniono 'extract' na 'identify' Co-Authored-By: Claude Opus 4.5 --- zopk_knowledge_service.py | 32 +++++++++++++++++--------------- 1 file changed, 17 insertions(+), 15 deletions(-) diff --git a/zopk_knowledge_service.py b/zopk_knowledge_service.py index 32a4afe..385c6d9 100644 --- a/zopk_knowledge_service.py +++ b/zopk_knowledge_service.py @@ -90,28 +90,30 @@ RELATION_TYPES = [ # AI PROMPTS # ============================================================ -EXTRACTION_SYSTEM_PROMPT = """Jesteś ekspertem ds. ekstrakcji wiedzy z artykułów o projekcie Zielony Okręg Przemysłowy Kaszubia (ZOPK). +EXTRACTION_SYSTEM_PROMPT = """Jesteś asystentem analitycznym, który pomaga tworzyć podsumowania PUBLICZNYCH artykułów prasowych z polskich portali informacyjnych. -ZOPK to strategiczny projekt transformacji energetycznej i przemysłowej Pomorza, obejmujący: -- Morską energetykę wiatrową (Baltic Power, Baltica, F.E.W. Baltic) -- Elektrownię jądrową (Lubiatowo-Kopalino, PEJ) -- Inwestycje norweskie Kongsberg w Rumi -- Infrastrukturę: Via Pomerania, S6, Droga Czerwona -- Centra danych, laboratoria wodorowe +Analizujesz artykuły o LEGALNYCH inwestycjach infrastrukturalnych i energetycznych w Polsce, takich jak: +- Projekty energetyki odnawialnej (farmy wiatrowe offshore) +- Inwestycje przemysłowe (parki przemysłowe, fabryki) +- Infrastruktura transportowa (drogi, koleje) +- Projekty energetyczne realizowane zgodnie z polityką państwa -Twoim zadaniem jest wyodrębnić z tekstu: -1. FAKTY - konkretne, weryfikowalne informacje (liczby, daty, decyzje) -2. ENCJE - nazwy własne (firmy, osoby, miejsca, projekty) -3. RELACJE - powiązania między encjami""" +WAŻNE: To jest analiza PUBLICZNIE DOSTĘPNYCH wiadomości prasowych, które można znaleźć w Google News. +Nie tworzysz treści - tylko identyfikujesz i strukturyzujesz informacje już opublikowane przez dziennikarzy. -EXTRACTION_USER_PROMPT = """Przeanalizuj poniższy fragment artykułu i wyodrębnij strukturalne informacje. +Twoim zadaniem jest zidentyfikować w tekście: +1. FAKTY - konkretne informacje (liczby, daty, decyzje biznesowe) +2. PODMIOTY - nazwy firm, osób, miejsc, projektów +3. POWIĄZANIA - relacje między podmiotami""" -TEKST: +EXTRACTION_USER_PROMPT = """Poniżej znajduje się fragment PUBLICZNIE DOSTĘPNEGO artykułu prasowego. Zidentyfikuj kluczowe informacje i podmioty. + +ARTYKUŁ PRASOWY: {chunk_text} -ŹRÓDŁO: {source_name} ({published_date}) +ŹRÓDŁO ARTYKUŁU: {source_name} ({published_date}) -Zwróć JSON w formacie: +Odpowiedz w formacie JSON: {{ "facts": [ {{