Сегодня, 28 октября, польские СМИ сообщили о неожиданном успехе польского языка в сфере искусственного интеллекта. Согласно исследованию учёных из Университета Мэриленда и Microsoft, польский оказался самым эффективным языком для работы с длинными контекстами в системах AI – обогнав даже английский.
Исследование под названием "One ruler to measure them all: Benchmarking multilingual long-context language models" охватило 26 языков и несколько популярных моделей, включая OpenAI o3-mini-high, Google Gemini 1.5 Flash и Llama 3.3 (70B). Учёные проверяли, как языки влияют на способность моделей понимать и обрабатывать длинные запросы – до 128 тысяч токенов.
Результаты оказались неожиданными: польский язык набрал 88% эффективности, опередив французский (87%), итальянский (86%) и испанский (85%). Русский занял пятое место с результатом 84%, а английский, несмотря на огромные обучающие базы, оказался лишь на шестом месте (83,9%).
Учёные подчёркивают, что это открытие может изменить подход к развитию многоязычных моделей. Несмотря на ограниченные данные для обучения, польский продемонстрировал высокую способность передавать смысл в сложных, контекстуально насыщенных задачах.
Эксперты считают, что результаты исследования могут стать стимулом для развития технологий искусственного интеллекта в Польше и показать, что даже "меньшие" языки способны играть ключевую роль в будущем мировой AI-индустрии.
Чтобы оставаться в курсе событий, подписывайтесь на Telegram-канал и Instagram или группу FB нашей «Витрины». Если вы хотите поделиться новостями с редакцией – пишите.