DSML KZ Новости


Channel's geo and language: Kazakhstan, Russian
Category: Technologies


Новости, митапы, ивенты, поздравляшки и прочие важные посты с чатика про машинное обучение в Казахстане:
Вакансии: @ml_jobs_kz
Вступить в сообщество: @databek_bot
LinkedinPage: linkedin.com/company/dsmlkz
Предложения и Реклама: @ayana_mussabayeva

Related channels  |  Similar channels

Channel's geo and language
Kazakhstan, Russian
Statistics
Posts filter


Интенсив по генеративным речевым технологиям от Яндекс Казахстан
22-26 апреля (прием заявок до 16 апреля)| Алматы

Занятия проведет опытный преподаватель из Школы Анализа Данных Яндекса, который поделится своими знаниями в области генеративных моделей и покажет, как обрабатывать большие объемы данных с использованием трансформеров для генерации новых цифровых продуктов, создания контента и работы с чат-ботами и голосовыми помощниками.

Участники получат уникальные навыки, которые помогут им стать более востребованными специалистами на рынке труда и расширить свои знания в сфере Data Science.

Слушатели должны знать основы машинного обучения, а также уметь использовать фреймворк обучения нейронных сетей pytorch.

Интенсив пройдет в Алматы с 22 по 26 апреля.
Заявки принимаются до 16 апреля включительно. Обучение полностью бесплатное.

Записаться на интенсив и пройти отбор можно по ссылке.


Я.Субботник по разработке интерфейсов | 13.04.2024 | Алматы, SmArt.Point
 
13 апреля в SmArt.Point (Байзакова, 280) Яндекс проводит традиционный митап. О новостях разработки расскажут:
 
Андрей Мелихов, ведущий разработчик в Yandex Cloud. Расскажет, как безопасно запускать код, к которому нет доверия
 
Владимир Гриненко, руководитель службы интерфейсов экосистемы. Поговорит о том, что на самом деле важно в разработке
 
Андрей Симонов, разработчик интерфейсов для Алисы и умных устройств. Расскажет, как гибридные приложения собрали в себе лучшее из двух миров разработки
 
Александр Николаичев, руководитель группы разработки в Yandex Infrastructure. Объяснит, как пользоваться Monaco Editor и как виджеты упрощают жизнь разработчика  
 
Никита Нигматуллин, разработчик интерфейсов в Яндексе. Расскажет про Yandex SmartCaptcha
 
Митап пройдёт только в офлайн-формате. Узнать подробности и зарегистрироваться можно здесь.


Global AI Bootcamp 2024 |15.03.2024 | Almaty, SmartPoint

AI Bootcamp — конференция, посвященная изучению последних тенденций, прорывов и практических применений Искусственного Интеллекта.
Участие в мероприятии бесплатное и возможно только при наличии регистрации.

Программа мероприятия:

Александр Ермаков, Microsoft MVP по Azure, управляющий партнер Awara IT, продемонстрирует подключение к реальному квантовому компьютеру, а также покажет временную разницу на поиск оптимального решения между обычным и квантовым компьютером.
Артем Черневский, сертифицированный инженер Microsoft, CEO академии Awara IT, поделится механизмами построения процесса управления работой больших языковых моделей в Azure ML Studio и Azure AI.
Максут Ермаханов, Azure DevOps MVP, GitHub Fasttrack partner, расскажет про повышение рабочего КПД с помощью AI и о возможностях GitHub Copilot.
Михаил Танько, архитектор AI&ML, расскажет про революцию в принятии решений через мульти-агентные AI системы.

Дата: 15 марта (пятница)
Место: Smart.Point (Байзакова 280)
Сбор гостей: 17:00 (кофе+фуршет), начало в 17:30


Beetech Conf | 27.04.2024 | Almaty

27 апреля в Алматы пройдёт ежегодная beetech conf от Beeline Казахстан.

Открыт сбор докладов на конференцию, где будут представлены самые актуальные и интересные кейсы с максимальной пользой для участников конфы.

Заявки принимаются до 7 марта. Переходите по ссылке и оставляйте заявки: Beetech 2024 speakers.

В этом году будет 3 стрима: Big Data, Engineering и Management (Product + Agile).

Фокусные темы этого года по Big Data:
• применение AI в производстве;
• инструменты для хранения и обработки больших данных (Hadoop / Spark / Airflow или аналоги);
• эксплуатация систем на базе машинного обучения: CI / CD пайплайны, ML Ops / ML Flow;
• версионирование моделей и датасетов.

Если у вас есть другая актуальная тема, то вы также можете заполнить заявку, и ее обязательно рассмотрят.

Прием заявок открыт до 7 марта
Beetech 2024 speakers


Поздравляем участника нашего Сообщества Исагали Конысбаева, который разработал уникальную рекомендательную систему для подбора вакансий на основе резюме соискателей, используя передовые модели NLP (Natural Language Processing)!

Эта система, в сотрудничестве со специалистами IT и аналитиками АО “Центр развития трудовых ресурсов” (АО “ЦРТР”), адаптирована и внедрена на платформе enbek.kz.

Сервис работает на основе FastAPI, sentence_transformers и PyTorch. Ядро системы состоит из NLP-модели, которая преобразует текст резюме и вакансий в так называемые embedding vectors. После фильтрации вакансий по различным параметрам, таким как регион или профессия, эти вектора используются для рассчета косинусного расстояния между векторами вакансий и вектором запроса резюме. Система выбирает ближайшие по расстоянию вектора по степени "схожести" (cosine similarity).

Особенностью этой системы является её способность обучаться не только на основе текущих профессий, но и на семантике образования, навыков и предыдущего опыта работы соискателя. Для этого Исагали использовал не окончательную модель, а checkpoint в середине процесса обучения, чтобы избежать переобучения исключительно на текущих профессиях.

Скорость выдачи рекомендаций высока благодаря использованию только retriever model, без дополнительной классификационной модели reranker. Обучение модели проводилось с использованием ContrastiveLoss, и хотя Исагали не успел исследовать другие функции потерь, потенциал для дальнейших улучшений системы остается огромным.

Этот проект, как сообщает пресс-релиз АО “ЦРТР”, не только демонстрирует важные инновации в области подбора персонала, но и открывает новые горизонты для использования NLP в решении реальных задач рынка труда.


Новая школа в Абайской области

Эта история началась во время карантина, когда Азамат и его друзья, вдохновились идеей открыть школу в Абайской области Казахстана. Цель этой школы необычна и амбициозна: подготовить учеников из обычных сельских школ к поступлению в престижные университеты лиги плюща, такие как Yale и Harvard.

Уникальная Цель: Дать Шанс Обычным Ученикам из села

Вместо того, чтобы ориентироваться на топовых учащихся из других школ, эта школа ставит своей целью находить обычных ребят из сельских районов, возможно даже с плохими оценками, но обладающих невероятной мотивацией и желанием учиться. Это подход, который подчеркивает веру в потенциал каждого ученика, независимо от его текущего академического уровня.

Новый Этап: Открытие Школы

В этом году школа начнет набор учеников для 10 и 11 классов. Поскольку до экзаменов ЕНТ остается мало времени, в 11 класс будут принимать по результатам экзамена, а в 10 класс — на основе собеседования.

После нескольких лет обучения в частной школе 125 high school и проживания в арендованном общежитии, эта инициатива наконец находит свой дом в собственном здании, благодаря поддержке спонсоров и усилиям команды.

Нужны конкретные шаги

История этой школы не только вдохновляет, но и показывает, что смелость верить в большие мечты и упорный труд могут преобразовать образовательную среду и открывать новые горизонты для молодых людей из самых отдаленных уголков мира.


Подписывайтесь на инстаграм аккаунт проекта!

Реб
ята будут рады провести экскурсию по школе для всех неравнодушных к развитию отечественного образования!


Yandex Cup 2023

Yandex Cup – это ежегодный чемпионат по программированию. Призовой фонд чемпионата в этом году будет эквивалентен 38 000 000 тенге. Чемпионат рассчитан на разработчиков всех уровней — от студентов до опытных специалистов.

Участники могут выбрать среди шести треков:
• аналитика
• машинное обучение
• спортивное программирование
• фронтенд-разработка
• бэкенд-разработка
• мобильная разработка

Подать заявку на участие необходимо на сайте до 29 октября включительно.
Сроки чемпионата:
• 23-29 октября – этап квалификации
• 4 ноября – полуфиналы
• 2-3 декабря – финал и церемония награждения

Очный финал пройдет в Алматы. Расходы на дорогу и проживание финалистов оплатит Яндекс


Наши товарищи Ерзат Дулат и Анвар Умаров из нашего сообщества на днях релизнул библиотеку для машинного обучения "Higgsfield".

Этот инструмент предоставляет возможность управления кластерами, обеспечивая их масштабируемость и отказоустойчивость.

Библиотека позволяет эффективно использовать ваш GPU-кластер, создавая системы сравнимые по мощности с ChatGPT.

Блогпост можно почитать тут

Всем успешных экспериментов! 🚀


Yandex Party Light для продактов и инженеров пройдет 20 октября в Алматы

Яндекс приглашает инженеров и продактов на уютный нетворкинг в пространство Hazbin в 17:00. Гарантировано будут:

- интересные доклады от ведущих специалистов Яндекса и представителей других компаний;
- неформальное общение про работу и жизнь;
- полезные знакомства и уютная атмосфера;
- вечеринка и код-баттл.

Если хотите попасть на мероприятие — регистрируйтесь


Казахстанский AI-стартап CerebraAI получает инвестиции в размере $4,1 млн

CerebraAI, которая разрабатывает решение на основе искусственного интеллекта для раннего диагностирования инсультов, успешно завершила раунд финансирования seed 2.

Ведущим инвестором раунда стал известный венчурный фонд Big Sky Capital. Круг инвесторов также включал в себя Most Ventures, Aloqa Ventures, Uzcard Ventures, а также частных инвесторов, таких как Тимур Турлов, UMAY angels и Ynta Group. Большинство инвесторов договорились о том, что окончательная стоимость стартапа будет определена в течение трех лет, в то время как другие согласились с текущей оценкой в $12 млн до инвестиций.

Адиль Нургожин, управляющий партнер Big Sky Capital, выразил уверенность в мировом потенциале CerebraAI и готовность поддерживать стартап на пути к успеху на американском рынке.

Со стороны сообщества мы поздравляем всех причастных ребят, а также дата саенс команду под руководством Жулдыз-Жана Сагимбаева

Linkedin


Дататон DataSaur 2023
14-15 октября | Астана, Nazarbayev University


Дататон проводится NU DataSci и ACM student chapter совместно с АО НИТ, предоставляющим три кейса по дата сайнс и машинному обучению с призовым фондом в 1 000 000 тенге за каждый кейс. Принять участие могут как соло игроки, так и команды (как минимум один участник команды должен находиться в Астане).

Регистрация активна по ссылке до 12 октября 23:59 (UTC+6).
Подробнее о дататоне на канале NU DataSci


8 сентября стартовал ежегодный чемпионат по программированию Alem cup 2023 от alem school при поддержке международного технопарка Astana Hub!

Участники соревнуются за денежные призы, создавая ботов для борьбы с другими игроками в компьютерной игре. Участвовать могут люди любого бэкграунда и возраста.

Призовой фонд составляет:
1 место: 1 000 000 тенге
2 место: 700 000 тенге
3 место: 400 000 тенге

Ваш код будет запускаться каждые 15 минут против кода других участников с похожим уровнем мастерства.
За победу над соперником начисляются очки рейтинга, за поражение, соответственно, снимаются;
После каждого запуска игр на арене формируется новый рейтинг.
До финала доходят 3 игрока с наивысшим рейтингом.


Поддерживаемые языки программирования: Python, C++, JS, Go, Pascal, Java, PHP, C, C#, Ruby, Kotlin, Blockly

Чемпионат
продлится до 12 октября.

Регистрация


The IEEE Signal Processing Society of Nazarbayev University is on the hunt for speakers for the upcoming event!

Whether you're into Data Science, Machine Learning, Communicational Signal Processing or related field, we want you to share your experience and wisdom with aspiring researchers and engineers.

The event is planned to take place on October 13-15th.
Contact @goofymonarch to participate as a speaker.


Курс «Аналитик данных» от Яндекс Практикума.

Как проходит обучение:
— Читаете теорию в интерактивном учебнике и тренируетесь писать код на нашей платформе. 
— Получаете задачу и сроки её выполнения, как настоящий аналитик.
— Делаете проект. Например — разрабатываете модель машинного обучения, которая прогнозирует отток клиентов в фитнес-центре. 
— Проект проверяет ревьюер и подсказывает, что улучшить. Вы вносите правки.
— Наставник-аналитик отвечает на вопросы и объясняет сложные темы.
— Вы учитесь в удобное время, главное — закончить проект в срок. 

И так — пока не дойдёте до дипломного проекта. В финале курса вы получаете сертификат от Яндекса и крепкое портфолио. А ещё — поддержку карьерного центра. Наша команда поможет составить резюме, проведёт тестовые собеседования и предложит партнёрские вакансии.

→ Готовы начать? Вводную часть курса «Аналитик данных» можно попробовать бесплатно.


Минувшим летом в Греции прошла 24 международная конференция по Digital Signal Processing (DSP2023), где были представлены статьи в сферах цифровой обработки сигналов и машинного обучения. Мемберы нашего сообщества Зангар Ермаганбет @goofymonarch и @Ayana_Mussabayeva, в соавторстве с профессорами NU, представили статью о double-input CNN, применяемом в спеллер системах для людей, страдающих амиотрофическим склерозом.

Суть спеллера (P300 Speller) - на экране мигают символы, и когда пользователь видит, как загорелся символ, который он хочет напечатать, это считается за целевой ответ. Задача сводится к бинарной классификации: сигнал либо целевой и юзер хочет напечатать подсвеченный символ, либо нет.

Авторы генерируют из EEG сигналов мозга два типа спектрограмм, используя независимый компонентный анализ и преобразование Фурье, после чего спектрограммы прогоняются через CNN с двойным входом.

Представленные результаты показывают, что представленный метод более эффективен сравнительно классических для BCI систем классификаторов вроде SVM или LDA.

Полная статья в открытом доступе на research gate.


Онлайн академия Datanomix, проводит набор на бесплатное обучение по направлению Аналитик данных в Qlik Sense

На курсе вас ожидает:
- Практические домашние задания
- Менторское сопровождение
- Еженедельные онлайн-консультации
- Тематические вебинары
- Сертификат по окончанию обучения

Финансирование обучения обеспечивает государство посредством программы Tech Orda.

Все подробности в чате


Дата Доклад
Attention is all you need

Источник: arxiv.org/abs/1706.03762

3 сентября 18:00
Место: Стрим канал Джимми Ямазаки twitch.tv/yamazakij

Докладчик: Джимми Ямазаки

Суть доклада: Детально разберем статью и механизмы, представленные в статье. Постараемся понять как и почему работает attention, погрузимся вглубь архитектуры трансформеров, напишем код и даже попробуем обучать на маленьких датасетах. В течении доклада, вы можете задавать свои вопросы на которые докладчик с удовольствием ответит


VeriMeet
8 сентября | 13:30 | Алматы |Коворкинг SmART.Point

Андрей Шадриков, R&D тимлид Verigram. «Улучшения будут. Как строить коммуникации в высокорисковых продуктах».

Радмир Кадыров, CV инженер Verigram. «Легко разглядеть: вызовы в определении качества в лицевой видеоаналитике».

Антон Мальцев, Lead ML инженер ArtiSight, Rembrain. «Детекция. Yolo или уже нет?».

Дмитрий Гордин, CV инженер Citix. «Готовим Компьютерное зрение, степень прожарки production-done».

Айгерим Камбетбаева, ML специалист Cybernet. «Путь от нуля до 3 миллионов диалогов в месяц за 2 года».

Кирилл Маркин, Lead Data Scientist Ozma, SOAX. «Миграция на «правильный» кластер Clickhouse: управление миллиардом новых записей ежедневно».

Участие в мероприятии бесплатное

Регистрация обязательна


Tech Orda от Astana Hub и EPAM запускают бесплатное обучение по программе ваучеров для граждан Республики Казахстан по программе Data Engineering для Middle- и Senior специалистов. Кандидаты, прошедшие все стадии отбора, смогут бесплатно обучаться на 6-ти месячных программах EPAM с еженедельными индивидуальными и групповыми онлайн-встречами с ментором.

Программа включает в себя 11 теоретических модулей и практику, где вы сможете получить базовые знания в области облачных вычислений, понимание, когда использовать локальные или облачные технологии, а также сможете применять набор инструментов дата-инженера в облаке, включая такие, как Databricks, HDInsight, Event Hug в Azure, Dataflow, Dataproc в GCP, Glue, Афина, EMR в AWS.

Подать заявку на программу можно тут.


Алгоритм компании Verigram получил наивысшую оценку NIST в категории «1:N Identification» (распознавание и сопоставление одного лица ко множеству).
Этот алгоритм позволяет мгновенно находить совпадения лиц в базах данных с миллионами записей.

Решение Verigram проходило исследование на базе данных из 12 миллионов фотографий.

NIST, National Institute of Standards and Technologies — это национальный институт стандартов и технологий при Министерстве торговли США, который отвечает за разработку и поддержание стандартов широкого круга технологических областей. NIST Face Recognition Vendor Test (FRVT) считается наиболее авторитетным эталоном для алгоритмов распознавания.

20 last posts shown.