Первый казахский лидерборд запущен! 🇰🇿 Так, тут большое событие! Мои друзья из прошлого поста сдержали обещание и выпустили лидерборд на основе бенчмарков, о которых мы говорили ранее. Вот ссылка:
https://huggingface.co/spaces/kz-transformers/kaz-llm-lb Что это значит для нашего языка и страны? Это огромный шаг для развития технологий на казахском языке! 🔥 Мы впервые видим инициативу, которая системно поднимает уровень AI-моделей для родного языка.
Раньше казахский часто оставался на задворках крупных AI-разработок. Этот лидерборд — шанс исправить ситуацию:
-
Стимул для открытых исследований. Разработчики по всему миру могут вносить вклад и улучшать модели на казахском.
-
Поддержка локальных разработчиков. Появляются метрики и инструменты, которые помогают создавать качественные продукты.
-
Инвестиции в будущее. Это закладывает основу для технологий, которые будут полезны бизнесу, образованию и государственным проектам.
Итоги первого запуска: --
Открытый сегмент:Лидирует ISSAI с моделью LLaMA-3.1-KazLLM-1.0-8B, которая дала +5% к своему бэкбону и обошла Google Gemma-2-9b-it на 1%.
--
Все модели:Абсолютный лидер —
GPT-4o, который опережает ближайшего конкурента Sonnet 3.5 на 2%.
Что дальше?1. Оффлайн арена с системой рейтинга ELO (духи шахмат уже ликуют!)
2. Более сложные бенчмарки для реальных задач. Это поможет проверить модели в боевых условиях.
3. Кастомные instruct-датасеты. Пора учить AI понимать наши реальные потребности.
Ребята открыты к предложениям и готовы сотрудничать! 🙌 Фидбек, новые идеи или сабмит своей модели — все это можно сделать через
GitHub или кнопку Submit на HuggingFace.
Давайте покажем поддержку!
🔗 Репостните, чтобы больше людей узнали о нашем лидерборде.
📢 Чем больше участников и идей, тем быстрее наш язык получит достойное представительство в мире AI.
Подключайтесь! 💪💪💪