Wyniki opublikowanego niedawno raportu, cytowanego m.in. przez serwis Benchmark.pl, mogą wydawać się wręcz nieprawdopodobne. Badanie zatytułowane "One ruler to measure them all: Benchmarking multilingual long-context language models" objęło 26 języków i kilka wiodących modeli AI, w tym OpenAI o3-mini-high, Google Gemini 1.5 Flash i Llama 3.3 (70B). Naukowcy sprawdzali, jak systemy radzą sobie z wyjątkowo długimi kontekstami – nawet do 128 tysięcy tokenów.
Efekt? Polski uzyskał najlepszy wynik ze wszystkich testowanych języków – 88 procent skuteczności. Za nim znalazły się: francuski (87 proc.), włoski (86 proc.), hiszpański (85 proc.) i rosyjski (84 proc.). Dopiero po nich pojawił się angielski – 83,9 proc.
Trudny, ale skuteczny
Jak to możliwe, że język o tak skomplikowanej gramatyce i zaledwie kilkudziesięciu milionach użytkowników okazał się skuteczniejszy od globalnego angielskiego? Naukowcy sugerują, że to właśnie jego złożoność może być… zaletą. Polski wymusza na modelach językowych bardziej precyzyjne rozumienie kontekstu, odmian i relacji między słowami.
W praktyce oznacza to, że gdy użytkownik formułuje dłuższe, rozbudowane polecenie (tzw. prompt), model w języku polskim lepiej itrafniej reaguje na niuanse. Innymi słowy – im bardziej skomplikowane zadanie, tym większa szansa, że po polsku zostanie ono wykonane dokładniej.
Nowy impuls dla polskiej sztucznej inteligencji
Odkrycie naukowców może mieć dla Polski większe znaczenie, niż się wydaje na pierwszy rzut oka. To nie tylko ciekawostka językowa, ale potencjalny punkt zwrotny dla rozwoju rodzimych technologii AI. Jeśli polski rzeczywiście okazuje się tak efektywny w pracy z dużymi modelami językowymi, może to zachęcić krajowe ośrodki badawcze i firmy technologiczne do tworzenia własnych, wyspecjalizowanych rozwiązań.
Język polski liderem
Jeszcze kilka lat temu trudno byłoby sobie wyobrazić, że język Sienkiewicza czy Miłosza stanie się numerem jeden w globalnym wyścigu AI. A jednak – dziś to właśnie on otwiera nowe drzwi w komunikacji człowieka z maszyną.
Wynik 88 procent nie tylko imponuje, ale też pokazuje, że warto inwestować w rozwój lokalnych modeli i narzędzi. Bo choć angielski wciąż dominuje w nauce i technologii, w świecie sztucznej inteligencji najwyraźniej nadszedł moment, by ustąpił miejsca komuś… kto mówi po polsku.
Źródło: Benchmark.pl, Business Insider