Rodzina PLLuM znowu się powiększa. Polskie AI coraz silniejsze
Co łączy pismo z urzędu, firmową bazę wiedzy, pomocnika AI w banku i aplikację, która ma odpowiedzieć użytkownikowi prostym językiem?


Właśnie z myślą o takich zastosowaniach rozwijany jest PLLuM – polska rodzina modeli językowych tworzona przez konsorcjum HIVE AI, którego liderem jest NASK. Do użytkowników trafia teraz 11 nowych modeli: od lekkich wariantów do prostszych zadań, po największy model 70B przeznaczony do bardziej wymagającej pracy z tekstem. To kolejny krok w budowie narzędzi AI, które można dopasować do realnych potrzeb administracji, biznesu i usług cyfrowych.
Nowe modele są dostępne otwarcie i bezpłatnie. Nie trzeba prosić o zgodę na ich pobranie ani raportować, gdzie zostały wdrożone. Takie podejście przyspiesza testowanie i rozwój zastosowań w różnych sektorach.
– Nowe modele można pobrać i wykorzystywać. Jest to całkowicie bezpłatne, otwarte dla każdego. Zapraszamy do testowania, komentowania i wskazywania, co jeszcze możemy poprawić, bo to też jest zawsze bardzo ważna informacja. Róbmy to wspólnie – podkreślał wiceminister cyfryzacji Dariusz Standerski.
– Chcemy, żeby PLLuM był coraz lepszy i znajdował zastosowanie w kolejnych miejscach. Już dziś korzystają z niego samorządy i instytucje, nie tylko państwowe. Cały czas się rozwijamy i tworzymy nowe modele. Przedstawiamy kolejny etap udostępniania rozwiązań generatywnej sztucznej inteligencji wytworzonych tu, w Polsce. Robimy to z poszanowaniem praw autorskich i jako jedni z pierwszych zgodnie z wytycznymi AI Act. To wynik prac prowadzonych w ramach konsorcjum. Zbudowaliśmy nie tylko modele językowe, ale i unikalne kompetencje w polskim ekosystemie AI – mówi dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK Szymon Łukasik.
PLLuM, czyli polski język w centrum technologii
PLLuM to polska rodzina modeli językowych, która ma wspierać pracę z tekstem, wiedzą i dokumentami. Może pomagać tam, gdzie człowiek na co dzień mierzy się z dużą liczbą informacji: przy wyszukiwaniu odpowiedzi w procedurach, streszczaniu treści, porządkowaniu dokumentów, przygotowywaniu projektów pism albo upraszczaniu języka, który zbyt często brzmi bardziej jak załącznik do decyzji niż komunikat dla człowieka.
Modele rozwijano z myślą o polszczyźnie w jej różnych odmianach. Nie tylko tej codziennej, znanej z rozmów czy internetu, ale też tej trudniejszej: urzędowej, prawnej, technicznej i instytucjonalnej. Właśnie tam precyzja ma największe znaczenie. Jedno źle rozumiane pojęcie, zbyt ogólna odpowiedź albo brak znajomości kontekstu mogą sprawić, że narzędzie AI będzie efektowne, ale mało użyteczne.
Nowe modele uczono na około 7 milionach polskojęzycznych tekstów. W zbiorze znalazły się m.in. akty prawne, stenogramy parlamentarne, zasoby domeny publicznej, materiały licencjonowane i treści dostępne na otwartych licencjach. Dane były sprawdzane pod kątem jakości, legalności wykorzystania i bezpieczeństwa. Osobną częścią prac było przygotowanie instrukcji, czyli par pytań i wzorcowych odpowiedzi, które pozwalają modelowi lepiej wykonywać konkretne zadania.
– Naszym bardzo wyraźnym punktem koncentracji była oczywiście zdolność modeli do porozumiewania się z użytkownikiem w języku polskim. Ta dbałość wiąże się z tym, że poza pozyskiwaniem danych ze źródeł transparentnych, co do których mamy pewność, że jesteśmy w stanie z nich korzystać, wytwarzamy również własne instrukcje, czyli pary pytanie–odpowiedź, tworzone w dużym stopniu manualnie przez analityków. Dzięki temu jesteśmy w stanie uzyskać tę kompetencję językową, której oczekujemy od modelu języka polskiego – mówił Szymon Łukasik z NASK.
Tak przygotowany PLLuM może być wykorzystywany w różnych typach rozwiązań. W administracji może wspierać pracę z pismami, procedurami i pytaniami obywateli. W biznesie – pomagać w przeszukiwaniu wewnętrznych regulacji, instrukcji czy baz wiedzy. W usługach cyfrowych – ułatwiać tworzenie systemów, które odpowiadają użytkownikom w bardziej zrozumiały sposób.
– Już od miesięcy nasz model jest wykorzystywany przez większość obywateli, nawet jeśli nie zawsze zdają sobie z tego sprawę. Każdy, kto ma aplikację mObywatel, korzysta już z tego, co oferuje polski model językowy PLLuM. A za kilka tygodni ruszamy również z wykorzystywaniem sztucznej inteligencji w pracach administracji publicznej, czyli z pierwszymi wdrożeniami w pracy urzędniczej w Ministerstwie Cyfryzacji oraz w Kancelarii Prezesa Rady Ministrów – podkreślił Szymon Łukasik.
Mały do prostych zadań, większy do trudniejszych
Nowa rodzina PLLuM obejmuje modele 4B, 8B, 12B i 70B. Litera „B” oznacza miliardy parametrów. Parametry można najprościej opisać jako elementy, dzięki którym model rozpoznaje zależności w języku i uczy się odpowiadać na polecenia. Większy model ma większe możliwości, ale potrzebuje też większej mocy obliczeniowej.
Wybór modelu zależy od zadania. Jeśli system ma wykonywać prostsze, powtarzalne czynności, nie zawsze potrzebuje największego wariantu. Z kolei jeśli ma analizować długie dokumenty, prowadzić bardziej złożoną rozmowę albo pracować z wieloma wątkami jednocześnie, większy model może sprawdzić się lepiej – w przypadku rodziny PLLuM byłby to model 70B.
Najlżejszą kategorią są modele 4B. To nowość w rodzinie PLLuM, przygotowana z myślą o środowiskach, w których liczy się szybkość działania i niższe wymagania sprzętowe. Mogą sprawdzać się przy jasno określonych zadaniach: wstępnym porządkowaniu dokumentów, prostszym wsparciu formularzy, klasyfikowaniu zgłoszeń albo jako element lokalnego systemu, który nie powinien wymagać bardzo rozbudowanej infrastruktury.
Modele 8B i 12B dają więcej możliwości, ale nadal pozostają stosunkowo lekkie. To dobry wybór dla wielu wdrożeń produkcyjnych, zwłaszcza tam, gdzie model ma współpracować z bazą dokumentów. Może pomagać w systemach, które odpowiadają na pytania na podstawie regulaminów, procedur, instrukcji albo wewnętrznych materiałów instytucji.
3 warianty nowych modeli
Modele są udostępnione w trzech wariantach: bazowym, instrukcyjnym oraz dialogowym.
– Wersja bazowa jest przeznaczona dla tych, którzy chcą dalej dostrajać model na własnych instrukcjach. Wersja instrukcyjna została już przygotowana do wykonywania konkretnych poleceń, w szczególności instrukcjach o charakterze urzędowym. Ostatnia kategoria to modele dialogowe, modele czat, które dodatkowo zostały wychowane. To wyraz naszej troski o to, by modele, poza transparentnością i zgodnością z aktami prawnymi, były również bezpieczne pod kątem używania przez użytkowników końcowych – wyjaśnił Szymon Łukasik.
Otwarte modele dla każdego
W administracji i sektorach regulowanych samo działanie modelu nie wystarcza. Ważne jest również to, czy można sprawdzić, jak powstał, na jakich danych był trenowany i jakie ma ograniczenia. Przy usługach publicznych przejrzystość staje się częścią bezpieczeństwa.
Wszystkie nowe modele PLLuM udostępniono na otwartych licencjach oraz z dokumentacją zgodną z wymaganiami AI Act. Dokumentacja opisuje m.in. źródła danych, sposoby ich przetwarzania, metody treningowe i ewaluacyjne. Podczas konferencji podkreślano, że to rozwiązanie wyróżnia polski projekt także na tle innych państw Unii Europejskiej.
– To unikalne rozwiązanie, ponieważ w państwie Unii Europejskiej to dalej jest nowość: są to pierwsze modele krajowe udostępniane przez administrację centralną z dokumentacją w pełnej zgodności z aktem o sztucznej inteligencji – mówił Dariusz Standerski, Sekretarz stanu w ministerstwie cyfryzacji.
Dla instytucji oznacza to większą kontrolę nad technologią. Można zobaczyć, z jakiego typu danych korzystano, jak oceniano model i gdzie przebiegają jego granice. To szczególnie ważne tam, gdzie AI ma wspierać pracę z dokumentami, obsługę obywateli albo procesy wymagające zaufania.
Nowe modele powstały w projekcie HIVE AI realizowanym w 2025 roku przez konsorcjum, w którego skład wchodzą: NASK jako lider, ACK Cyfronet AGH, Centralny Ośrodek Informatyki, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, OPI PIB, Politechnika Wrocławska i Uniwersytet Łódzki. Kierowniczką projektu była dr Agnieszka Karlińska, a kierownikiem operacyjnym dr hab. prof. UŁ Piotr Pęzik.
Wszystkich zainteresowanych rozwojem polskiej rodziny modeli językowych PLLuM zapraszamy do dołączenia do społeczności PLLuM na Discordzie.
Wyróżnione aktualności
Pedofilia w internecie kwitnie dzięki AI. Raport Dyżurnet.pl za 2025 rok
300 proc. rok do roku. O tyle wzrosła liczba materiałów wygenerowanych przez AI, które przedstawiają seksualne wykorzystanie dzieci. Znacząco rośnie udział komunikatorów internetowych w dystrybucji CSAM. O tym mówi raport roczny z działań Dyżurnet.pl - zespołu, który w ramach NASK przyjmuje i analizuje zgłoszenia związane z treściami nielegalnymi i szkodliwymi dla dzieci i młodzieży.
Centrum Cyberbezpieczeństwa NASK o krok bliżej
Ultranowoczesne Centrum Cyberbezpieczeństwa NASK powstanie na warszawskiej Pradze-Północ, a w nim m.in. laboratoria do rozwoju sztucznej inteligencji czy Centrum Odzyskiwania Danych. Instytut właśnie uzyskał decyzję o pozwoleniu na budowę CCN. To już tylko jeden krok od symbolicznego “wbicia łopaty” i – co za tym idzie – wzmocnienia krajowego systemu cyberbezpieczeństwa.
NASK na Impact’26. Technologia po właściwej stronie
– W tym roku przyjechaliśmy na Impact z wyjątkową agendą, bo zależało nam na tym, aby w atrakcyjny i angażujący sposób opowiedzieć o tym, czym zajmujemy się na co dzień. Za nami inspirujące debaty poświęcone twórcom i sztucznej inteligencji, cyberbezpieczeństwu oraz wyzwaniom, jakie niesie cyfrowy świat – podsumowywał obecność NASK na Impact’26 szef instytutu Radosław Nielek.
Najnowsze aktualności
Jedno miejsce, jeden system, szybsza reakcja. S46 Cyber Hub już działa
Tysiące organizacji, po wdrożeniu dyrektywy NIS2, będą musiały zgłaszać incydenty, reagować na zagrożenia i spełniać nowe obowiązki związane z cyberbezpieczeństwem. To odpowiedź na rzeczywistość, w której cyberataki coraz częściej wymierzone są nie tylko w wielkie korporacje czy instytucje państwowe, ale także firmy i organizacje odpowiadające za usługi, z których korzystamy każdego dnia.
Administracja bez papieru. EZD RP staje się nowym standardem
Ćwierć miliona ludzi i ponad trzy tysiące jednostek administracyjnych. Te liczby pokazują skalę wdrożeń EZD RP – pierwsza to użytkownicy, druga – liczba podmiotów, które z niego korzystają. System do elektronicznego zarządzania dokumentacją, stworzony przez NASK, to rewolucja w świecie administracji publicznej. Rewolucja, po którą sięga coraz więcej jednostek, a to najlepsze potwierdzenie jakości.
Nie daj się oszukać „na Booking”! Zobacz, jak się chronić
Planowanie urlopu zaczyna się w sieci – od łatwego porównania ofert po szybką rezerwację noclegu. Wygoda ma jednak swoją cenę. W sezonie wakacyjnym rośnie aktywność oszustów, którzy próbują wykorzystać pośpiech i nieuwagę urlopowiczów. Można się jednak przed tym uchronić.






