Сегодня, 28 октября, польские СМИ сообщили о неожиданном успехе польского языка в сфере искусственного интеллекта. Согласно исследованию учёных из Университета Мэриленда и Microsoft, польский оказался самым эффективным языком для работы с длинными контекстами в системах AI – обогнав даже английский.

Исследование под названием "One ruler to measure them all: Benchmarking multilingual long-context language models" охватило 26 языков и несколько популярных моделей, включая OpenAI o3-mini-high, Google Gemini 1.5 Flash и Llama 3.3 (70B). Учёные проверяли, как языки влияют на способность моделей понимать и обрабатывать длинные запросы – до 128 тысяч токенов.

Результаты оказались неожиданными: польский язык набрал 88% эффективности, опередив французский (87%), итальянский (86%) и испанский (85%). Русский занял пятое место с результатом 84%, а английский, несмотря на огромные обучающие базы, оказался лишь на шестом месте (83,9%).

Учёные подчёркивают, что это открытие может изменить подход к развитию многоязычных моделей. Несмотря на ограниченные данные для обучения, польский продемонстрировал высокую способность передавать смысл в сложных, контекстуально насыщенных задачах.

Эксперты считают, что результаты исследования могут стать стимулом для развития технологий искусственного интеллекта в Польше и показать, что даже "меньшие" языки способны играть ключевую роль в будущем мировой AI-индустрии.