diff --git a/zopk_knowledge_service.py b/zopk_knowledge_service.py index 32a4afe..385c6d9 100644 --- a/zopk_knowledge_service.py +++ b/zopk_knowledge_service.py @@ -90,28 +90,30 @@ RELATION_TYPES = [ # AI PROMPTS # ============================================================ -EXTRACTION_SYSTEM_PROMPT = """Jesteś ekspertem ds. ekstrakcji wiedzy z artykułów o projekcie Zielony Okręg Przemysłowy Kaszubia (ZOPK). +EXTRACTION_SYSTEM_PROMPT = """Jesteś asystentem analitycznym, który pomaga tworzyć podsumowania PUBLICZNYCH artykułów prasowych z polskich portali informacyjnych. -ZOPK to strategiczny projekt transformacji energetycznej i przemysłowej Pomorza, obejmujący: -- Morską energetykę wiatrową (Baltic Power, Baltica, F.E.W. Baltic) -- Elektrownię jądrową (Lubiatowo-Kopalino, PEJ) -- Inwestycje norweskie Kongsberg w Rumi -- Infrastrukturę: Via Pomerania, S6, Droga Czerwona -- Centra danych, laboratoria wodorowe +Analizujesz artykuły o LEGALNYCH inwestycjach infrastrukturalnych i energetycznych w Polsce, takich jak: +- Projekty energetyki odnawialnej (farmy wiatrowe offshore) +- Inwestycje przemysłowe (parki przemysłowe, fabryki) +- Infrastruktura transportowa (drogi, koleje) +- Projekty energetyczne realizowane zgodnie z polityką państwa -Twoim zadaniem jest wyodrębnić z tekstu: -1. FAKTY - konkretne, weryfikowalne informacje (liczby, daty, decyzje) -2. ENCJE - nazwy własne (firmy, osoby, miejsca, projekty) -3. RELACJE - powiązania między encjami""" +WAŻNE: To jest analiza PUBLICZNIE DOSTĘPNYCH wiadomości prasowych, które można znaleźć w Google News. +Nie tworzysz treści - tylko identyfikujesz i strukturyzujesz informacje już opublikowane przez dziennikarzy. -EXTRACTION_USER_PROMPT = """Przeanalizuj poniższy fragment artykułu i wyodrębnij strukturalne informacje. +Twoim zadaniem jest zidentyfikować w tekście: +1. FAKTY - konkretne informacje (liczby, daty, decyzje biznesowe) +2. PODMIOTY - nazwy firm, osób, miejsc, projektów +3. POWIĄZANIA - relacje między podmiotami""" -TEKST: +EXTRACTION_USER_PROMPT = """Poniżej znajduje się fragment PUBLICZNIE DOSTĘPNEGO artykułu prasowego. Zidentyfikuj kluczowe informacje i podmioty. + +ARTYKUŁ PRASOWY: {chunk_text} -ŹRÓDŁO: {source_name} ({published_date}) +ŹRÓDŁO ARTYKUŁU: {source_name} ({published_date}) -Zwróć JSON w formacie: +Odpowiedz w formacie JSON: {{ "facts": [ {{