
Fot. pixabay/yeiferr
Polska buduje własną sztuczną inteligencję. Od dziś PLLuM jest dostępny dla każdego
PLLuM (Polish Large Language Model) to rodzina modeli sztucznej inteligencji, która pozwala przetwarzać i generować teksty w języku polskim. Modele stworzone przez polskich ekspertów i ekspertki z dziedziny IT i lingwistyki, wesprą rozwój kompetencji cyfrowych oraz innowacje w administracji publicznej i biznesie. Ministerstwo Cyfryzacji zaprezentowało polski model językowy PLLuM oraz plan jego rozwoju.
Od dziś model dostępny jest dla każdego.
„PLLuM to dowód na to, że możemy rozwijać nowoczesne technologie na własnych warunkach, w naszym języku, z korzyścią dla obywatelek i obywateli. Tworzymy fundament pod inteligentne usługi publiczne i innowacje, które będą realnym wsparciem zarówno dla administracji, jak i biznesu” – mówi wicepremier i minister cyfryzacji Krzysztof Gawkowski.
„Cześć, jestem PLLuM. Oto moje zalety”
– Polski model językowy jest elastyczny i skalowalny – wykorzystuje od 8 do 70 miliardów parametrów. Pozwala na precyzyjne generowanie treści w języku polskim. Mniejsze wersje dobrze sprawdzają się w szybkich zadaniach, podczas gdy większe modele oferują wyższą precyzję i kontekstową spójność w rozumieniu języka polskiego. W rodzinie modeli PLLuM znajdują się m.in. modele w architekturze MoE (ang. Mixture of Experts) ze zrównoważonym wyborem ekspertów oraz wyspecjalizowane modele RAG (ang. Retrieval Augmented Generation).
– Bazuje na etycznym pozyskiwaniu danych – wersje do użytku komercyjnego wykorzystują zasoby tekstowe od właścicieli, którzy udzielili licencji konsorcjum, a także zasoby, które, zgodnie z ustawą o prawie autorskim i prawach pokrewnych oraz przepisami UE, mogą być wykorzystane do budowy w pełni otwartego modelu. Modele naukowe (tj. udostępniane na licencjach, które nie pozwalają na zastosowania komercyjne) korzystają także z ogólnodostępnych zbiorów danych, takich jak Common Crawl.
– Dostrajany na autorskich zbiorach danych, czyli dziesiątkach tysięcy tzw. instrukcji – pobudzeń (promptów) i oczekiwanych odpowiedzi modelu – oraz preferencji – pobudzeń i różnych odpowiedzi modeli ocenionych pod kątem jakościowym – tworzonych przez zespół ponad 50 specjalistów i specjalistek.
– Budowanie ekosystemu polskich modeli językowych. Wspólnie z modelem Bielik mogą promować sztuczną inteligencję tworzoną w Polsce, wspierając się wzajemnie w lepszym procesie trenowania i dalszym pozyskiwaniu oraz otwieraniu danych, potrzebnych by #AIMadeInPoland było coraz lepsze – dla administracji publicznej, biznesu i społeczeństwa.

Budowa ekosystemu rozwoju dużych modeli językowych w Polsce
„Rozwój PLLuM to inwestycja w cyfrowe państwo. Do tej pory przeznaczyliśmy na ten projekt 14,5 mln zł, a teraz idziemy krok dalej – kolejne 19 mln zł pozwoli na wdrożenie modelu w administracji publicznej i rozszerzenie współpracy o nowych partnerów, takich jak COI i Cyfronet. Dzięki temu PLLuM stanie się kluczowym elementem cyfryzacji usług publicznych i rozwoju krajowego ekosystemu AI” – powiedział wiceminister cyfryzacji Dariusz Standerski.
Projekt realizowany jest na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM. Projekt realizowany był do tej pory przez konsorcjum sześciu podmiotów:
– Politechnika Wrocławska (lider projektu)
– Instytut Podstaw Informatyki PAN
– Instytut Slawistyki PAN
– Naukowa i Akademicka Sieć Komputerowa (NASK-PIB)
– Ośrodek Przetwarzania Informacji (OPI-PIB)
– Uniwersytet Łódzki
– Szerokie zastosowanie PLLuM
PLLuM wyróżnia się na tle innych modeli językowych. Jest dostosowany do specyfiki języka polskiego oraz terminologii administracji publicznej. W procesie jego tworzenia stosuje kompleksowe procedury gromadzenia danych i oceny ich jakości. PLLuM przede wszystkim korzysta z danych organicznych – opracowywanych ręcznie, a nie przy użyciu innych modeli językowych. Trenowany na polskich zasobach, bardzo dobrze radzi sobie z wyzwaniami fleksji i złożonej składni generując precyzyjne treści.
PLLuM dostarczy zaawansowanych rozwiązań dla administracji publicznej i tym samym wesprze dalszą cyfryzację Polski:
– Wirtualny asystent w mObywatel, który wesprze obywateli i obywatelki w uzyskiwaniu informacji publicznych.
– Inteligentny asystent urzędniczy, który zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i wsparcie w udzielaniu odpowiedzi na pytania obywateli i obywatelek.
– Edukacja, ułatwi rozwój aplikacji edukacyjnych, tłumaczeń i pomoc nauczycielom i nauczycielkom w prowadzeniu angażujących lekcji z użyciem najnowszych technologii.

Centralny Ośrodek Informatyki i ACK CYFRONET AGH dołączają do projektu
Ministerstwo Cyfryzacji przyzna konsorcjum dotację w wysokości 19 mln zł na dalszy rozwój projektu. Lider konsorcjum HIVE – Ośrodek Badań nad Bezpieczeństwem SI w NASK – będzie koordynować prace wdrożeniowe PLLuM w usługach administracji publicznej.
W 2025 r. do konsorcjum PLLuM dołączy Centralny Ośrodek Informatyki, który będzie wdrażać model, jako narzędzia dla urzędników i w mObywatelu. W aplikacji pojawi się wirtualny asystent, który ułatwi obywatelom korzystanie z usług administracji publicznej. Akademickie Centrum Komputerowe CYFRONET AGH będzie natomiast dostarczać mocy obliczeniowych pod uczenie modeli i ich udostępnianie. Cyfronet AGH dysponuje nowoczesną infrastrukturą obliczeniową w tym najszybszym superkomputerem w Polsce.
Rozwój projektu oraz zaangażowanie nowych partnerów – Centralnego Ośrodka Informatyki i CYFRONET-u, torują drogę do jeszcze szerszego zastosowania AI w życiu codziennym. Polska staje się jednym z liderów w rozwoju modeli językowych, co przekłada się na wzrost innowacyjności i konkurencyjności całej gospodarki.
Inwestycje w AI dla rozwoju gospodarki i sektora IT
Rozwój PLLuM to także szansa na wzmocnienie konkurencyjności Polski w sektorze IT i całej gospodarce. Inwestycje w sztuczną inteligencję przyczyniają się do powstawania nowych firm i produktów opartych na AI, napędzając wzrost gospodarczy. Wykorzystanie PLLuM w różnych obszarach – od edukacji i administracji po sektor prywatny – sprzyja tworzeniu nowoczesnych rozwiązań, które umacniają pozycję Polski wśród liderów rozwoju AI.
PLLuM jest dostępny na stronie: http://pllum.clarin-pl.eu. Modele można pobrać na Hugging Face (https://router.huggingface.co/CYFRAGOVPL).
UWAGA: komunikaty publikowane są w serwisie PAP bez wprowadzania przez PAP SA jakichkolwiek zmian w ich treści, w formie dostarczonej przez nadawcę. Nadawca komunikatu ponosi odpowiedzialność za jego treść – z zastrzeżeniem postanowień art. 42 ust. 2 ustawy prawo prasowe.
Wybrane dla Ciebie
Czytałeś? Wesprzyj nas!
Działamy także dzięki Waszej pomocy. Wesprzyj działalność ewangelizacyjną naszej redakcji!
Zobacz także |
Wasze komentarze |