BigData Team (BDT)


Channel's geo and language: Kazakhstan, Russian
Category: Technologies


BigData Team: the way you learn best
Практико-ориентированное обучение по Big Data, Machine Learning, промышленной разработке на Python.
https://bigdatateam.org/ru

Related channels  |  Similar channels

Channel's geo and language
Kazakhstan, Russian
Statistics
Posts filter


✍️ Востребованные в индустрии навыки

BigData Team - это не только ценных мех обучение, но и профессиональное сообщество. Прежде чем разрабатывать новый учебный модуль мы обсуждаем с коллегами, какие знания и навыки востребованы непосредственно в их IT-департаменте.

Боли SQL из первых уст:
с оконными функциями прям беда, когда чуть более сложные ранжирования

(c) Алексей Казюлин, Senior Manager @ Yandex.Лавка

В целом, мы собрали список из 10 болей SQL. Поможете собрать 100 лайков, чтобы узнать остальные?

P.S. если казы собирают 35+ лайков, то будет ли сложно собрать 100 лайков по целевой тематике? 🤔 казы vs SQL, round 1

BigData Team: the way your learn best
#study


🧠 Внимание, NLP-специалисты Алматы! 🧠

Уже 24 октября в 17:00 пройдет митап от Beeline Kazakhstan и QazCode, посвященный языковым моделям! 🔥

🎉 Специально для наших подписчиков проводим конкурс: напишите “➕” в комментариях, и случайным образом мы выберем одного счастливчика, который получит гарантированное место на мероприятии!

Результаты будут объявлены 23 октября в 15:00 (ALA)

📍Конкурс открыт только для жителей Алматы, но если вы из другого города, не стесняйтесь, напишите свой город в комментариях — нам важно знать, где еще есть интерес к NLP!

Не упустите шанс окунуться в мир языковых моделей и получить ценные знания! 🚀

#study #life


Forward from: DSML KZ Новости
Митап для NLP специалистов от Beeline Kazakhstan и QazCode | 24.10.2024, 17:00 | Almaty

24 октября в DAR U мы подискутируем о языковых моделях! Data Scientist QazСode (Beeline) Бексултан Сагындык поделится свежими трендами в NLP и расскажет, как казахский язык интегрируется в эпоху LLM. Бексултан - один из тех, кто разрабатывает ИИ на казахском в Beeline Казахстан и QazCode.

А после - квартирник с экспертами из QazCode, Big Data Team и Conformal Group, с дискуссией об NLP в бизнесе: как применять LLMs в реальных кейсах.

Дата: 24.10, 17:00
Место проведения: DAR U, Коктем-2, 22, 4 этаж

Мероприятие бесплатное, но количество мест ограничено, регистрация по ссылке


🔬 Big Datych учится быть учителем

Еще никогда не было так просто подружить LLM с векторной базой данных. Зацените, что умеет новая версия Big Datych'а, полностью изолированная от интернета.

💁‍♂️ Технические детали: за основу взяли LLama3.1 8B и, вероятно, месяц+ будем чистить для него данные. У нас благо накопилось несколько лет коммуникаций со слушателями курсов по Big Data, Python и Machine Learning. Как будет время - расскажем поподробнее. Кому не терпится попробовать самостоятельно - ловите ссылку на github и сохраняйте пост в "любимые" 🫶

🔥 Выпускники учебной программы Big Data / Machine Learning Engineer (проходит при поддержке грантов Tech Orda и BigData Team) научатся дообучать LLM в консоли (ноутбуках) под нужды компании, поэтому записывайтесь в очередь за выпускниками по адресу study@bigdatateam.org.

BigData Team: the way your learn best
#work #study #BigDatych


Forward from: Заметки математика-программиста, Алексей Драль
👨‍💻 VSCode без Microsoft телеметрии

Программистам на заметку:
https://github.com/VSCodium/vscodium

Вопрос в продолжение голосовалки за любимый редактор: у кого-нибудь безопасники проверяли исходники VSCodium? Microsoft телеметрии нет, но, возможно, какие другие закопали?

P.S. ChatGPT за эту информацию мамой не клянется 🤔

#work


😊 Инсайды второй недели обучения

Пишите в комментариях: а какой ваш любимый редактор или IDE?

// Credit (за находку): Виталий М.

#meme #random


🎉 Big Data кораблю - Big Data плавание. Мы запустились!

Счастливых людей как на фото, так и за черными экранами монитора, ждет большое путешествие в мир Big Data и Machine Learning инженерии. Пожелайте коллегам удачи! ❤️

На первой неделе обучения мы уже успели поговорить про профайлинг кода на Python, оптимизацию вычислений и ООП. Неплохой старт, неправда ли?

Если хотите погрузить в мир ООП самостоятельно, от уровня "beginner" до уровня "advanced", то обратите внимание на нашу подборку:
📚 Классы и ООП, полезные материалы

BigData Team: the way your learn best
#work #study #life


отгадайте кто это?

// ответ под катом

#random


Forward from: Заметки математика-программиста, Алексей Драль
🔬 Августовские LLM-эксперименты

Изолированного от интернета (и адекватного) LLM-помощника для изучения казахского языка я пока еще не запустил. Хотя релиз Llama 405B намекает, что все возможно (если у вас свой GPU кластер 😬). Для ноута модельки можно выбрать полегче и посмотреть на качество 8B (как говорится, подписывайтесь и ставьте лайки).

Для работы решил сократить T2M и подключил нейро-помощника с интеграцией в Google (модели Gemini) и Open AI. Приятно, что Google (в отличие от Open AI) можно подключить по API абсолютно бесплатно, без с регистрацией, но хотя бы без смс.

Считаем ROI:
инвестиции: 3.5 часа на изучение документации, эксперименты и поиск котиков
результат: сервис на streamlit с интеграцией в несколько LLM по API. Керемет!

🤔 Какая-нибудь инструкция нужна, чтобы запустить это самостоятельно или (для программистов) и так все ясно?

#work #life


📚 Подборка книг для жизни

Слушатели Практического курса по Big Data, собрали подборку книг, которые цепляют, вдохновляют или даже меняют мировоззрение ♥️

Делимся этим сокровищем с вами:
1. Эрнест Хемингуэй, По ком звонит колокол
2. Хорхе Луис Борхес, Сад расходящихся тропок
3. Рэй Дуглас Брэдбери, Лед и пламя
4. Дэвид Дойч, Начало бесконечности
5. Чак Паланик, Бойцовский клуб
6. Джо Аберкромби, любые произведения
7. Уильям Гибсон, Киберпространство (трилогия)
8. Роберт Хайнлайн, Время для звёзд
9. Антуан де Сент-Экзюпери, Маленький принц
10. Федор Достоевский, Бесы

И еще немного рекомендаций:
🔸 Юваль Ной Харари, Sapiens. Краткая история человечества
🔸 Джордж Самюэль Клейсон, Самый богатый человек в Вавилоне
🔸 Ben Bergeron, Christine Bald, Unlocking Potential: How Great Leaders Get The Most Out of Individuals, Teams & Organizations

👉 Делитесь в комментариях, какие книги вдохновляют вас. Другие интересные подборки, доступны в разделе "заметки выпускников" 🎓 #alumni

🗓 обучения в 2024
#study #life

919 1 24 1 17

Forward from: Заметки математика-программиста, Алексей Драль
📚 Fairness-Aware Meta-Learning via Nash Bargaining

Вам приходилось слышать, чтобы Джордан использовал подходы Нэша? Если вы про баскетбол, то нет, а если про математику - то ловите.

Некоторые факты:
— статья свежая, опубликована на arXiv в июне 2024-го
— часть работы была сделана при участии коллег из Meta AI
— работа выполнена при поддержке европейского гранта ERC Ocean

Подход может применяться в ML при работе с "несбалансированными" датасетами. Чуть точнее в части перевода "imbalanced" — там где нам важно качество не в среднем, а по каждому классу (тизер на скриншоте).

Отдельный респект:
— код доступен на github: reds-lab/Nash-Meta-Learning

Всем приятного чтения и использования в production.

🤗 плюс в карму за лайк и репост

#study


🎁 Гранты от BigData Team

Завтра (20.08) начинается раунд 2 распределения грантов и "листов ожидания" на платформе Astana Hub:
🧑‍🏫 20-22 августа, вы можете принять "грант", условия обучения в формате "лист ожидания" (обучение совместно с общей группой грантников, с возможностью перейти на обучение по гранту на условиях школы) или пропустить раунд.

см. полный timeline

Наша школа распределила около 40 грантов Tech Orda. Решением директора, компания выделила 10 грантов в размере 600,000 тенге от BigData Team (грант BDT) . 7 грантов BDT (статус "лист ожидания" на платформе Astana Hub) уже согласованы, осталось еще 3.

Каждый, кто проходил тестирование, получил обратную связь по почте (на всякий случай проверьте папку "спам"). Гранты BDT получат те, кто первым примет решение по обучению и предпримет шаги для их согласования.

Есть кандидаты, которым было отправлено предложение гранта, но поскольку согласование шло медленно, то эти гранты освободили и предоставляем в рамках общего конкурса. Смело пишите на почту techorda@bigdatateam.org и уточняйте условия.

BigData Team: the way your learn best
#work #study #BigDataTeam #TechOrda #AstanaHub


🍪 Тема дня: файлы cookie

Пока:
1. IT школы распределяют гранты для раунда 2
2. Вы решаетесь записаться на курс по Big Data
2. Или просто ждете новых анонсов BigData Team: Learning Series

Рекомендуем познакомиться или освежить знания по теме "cookies" в картинках.

🔄 Тема прошлого выпуска: рекурсия

credit за находку: руководителю инфраструктуры BigData Team

#meme


🔥 Big Data, осталось 4 места

Возвращаемся к международным новостям или рубрике "не Tech Orda единым". Многие любят делать все в последний момент (пример), поэтому напомним:
— Практический курс по Big Data проходит два раза в год
— Если хотите на Big Data и не запишитесь сейчас, то следующая доступная запись будет на февраль 2025-го

Ключевая информация
🗓 2 поток: 19.08.2024 — 27.10.2024
👉 полное описание + запись
▶️ пример видеоролика с курса (5 min)

Дополним новым отзывом выпускника последнего запуска:
Ваш курс — это топ из всего, что я видел. Я занимался на Coursera, на разных платформах, и, действительно, у вас всё настолько качественно проработано: и отношение, и обновления, и быстрое оперативное решение всех проблем. У меня только положительные эмоции после курса. В итоге я понимаю, что в голове осталось немало полезной информации, тем более что задачи очень хорошо практически закрепляются. Если просто посмотрел видео и пошёл бы дальше, то осталось бы, как Алексей изначально говорил, процентов 10 в лучшем случае, с непониманием что это за информация и что с ней дальше делать. Я остался очень доволен и курсом, и полученным результатом.

(c) Сергей

BigData Team: the way your learn best
#work #study #feedback


Новости

Astana Hub перенесла начало раунда 1 (для принятия заявок кандидадатми на грант) на завтра (13-е августа)

Просьба не беспокоиться.

Peace, love, обнимашки 🤗


Кто рано сдает, тому BigData Team грант выдает... 🤌

Мы решили переиграть в словах и посчитать в цифрах народную мудрость (не путать с феноменом "мудрость толпы" Фрэнсиса Гальтона, широко используемой в ансамблевых алгоритмах машинного обучения)

У нас было три основных волны отбора кандидатов + 1 дополнительная (последний вагон). Несложно догадаться, что кто раньше встал сдал, того и тапки гранты. Но для математиков (аналитиков), всегда интересно посчитать "the odds" (шансы, будь то игра в покер или оптимизация логистической регрессии на обучающей выборке).

Возьмем для примера конкурс по Астане:
1:5 — если сдали тест вовремя, то конкурс 5 кандидатов на место
1:10 — если сдали тестирование неделей позже ("последний вагон"), то шансы в 2 раза хуже
1:4 — если сдавали тестирование на неделю раньше до объявленного всегобщего дедлайна (волна 2)
1:3 — за 2 недели раньше 😱

Ну что, будете теперь заблаговременно сдавать проекты, домашние задания, тестирования или заблаговременно начинать подготовку к важным моментам в жизни?

Если полезно - ставь лайк и пересылай другу, который делает все в последний момент 😉

BigData Team: the way your learn best
#random


✍️ Tech Orda, как не упустить грант, бюрократия

Ключевые даты/моменты:
— 7 августа, 23:59
— 12-15 августа
— рабочий ЭЦП

1️⃣ Общая инструкция, независимо от выбора школы обучения.

🧑‍🏫 7 августа, 23:59, закроется прием заявок на обучение в школах
если вы не подали заявку в школу на портале Astana Hub , школа вам грант выдать не сможет! (пример: курс BDMLE)
🏛 8-11 августа, на платформе Astana Hub школы распределят гранты

Раунд 1
🧑‍🏫 12-15 августа, вы можете принять одно предложение от школы или пропустить раунд (в надежде, что освободится грант у той школы, в которую вы хотите попасть). Принять = подписать с помощью ЭЦП.
🏛 16-19 августа, школы распределяют гранты, которые могли освободиться в связи с предыдущим пунктом.

Раунд 2
🧑‍🏫 20-22 августа, вы можете принять "грант", условия обучения в формате "лист ожидания" (обучение совместно с общей группой грантников, с возможностью перейти на обучение по гранту на условиях школы) или пропустить раунд.
🏛 23-26 августа, школы перераспределяют освоободившиеся гранты

Раунд 3
🧑‍🏫 27-28 августа, принять окончательное решение (учиться в какой-либо школе или сохранить возможный грант на обучение в следующем году)
🏛 29-30 августа, бюрократия между студентами, школами и Фондом (Astana Hub), распределяющим гранты Tech Orda.

🍁🧑‍🏫🏛 сентябрь, старт обучения

2️⃣ Как это будет проходить в BigData Team

По опыту прошлого, почти все гранты будут согласованы (подписаны) в рамках Раунда 1. Есть шанс, что:
а) кто-то будет недоступен (или медленно отвечать) ==> освободится грант;
б) вы тот самый самородок, которого мы случайно пропустили при разборе тестирований ==> мы предложим индивидуальный грант в формате "лист ожидания" в рамках Раунда 2.

Но поскольку это не точно (с), то мы рекомендуем проверить почту, спам и каналы коммуникации (телеграм). Сегодня (7 августа) мы разослали предложение финальной десятке счастливчиков с предложением обучения по грантам. Если кто-то из них не согласует обучение в ближайшие дни, то некоторые гранты могут освободиться.

👉 call to action: ставь лайк, сохрани себе и перешли другу

P.S. всем, кто прошел тестирование, мы обязательно ответим с рекомендациями по обучению и индивидуальными предложениями 8-15 августа.

BigData Team: the way your learn best
#work #study #BigDataTeam #TechOrda #AstanaHub


⬆️ начало ⬆️

🎁 Для тех, кто только проснулся, объявляем последний раунд отбора (можем рассмотреть в рамках именных грантов от BigData Team и IT-друзей):
— I волна (сдача тестирования до 23:59, 14.07)
— II волна (сдача тестирования до 23:59, 21.07)
— III волна (сдача тестирования до 23:59, 28.07)
волна "в последний вагон" (до 23:59, 04.08)

Истории успеха для вдохновения:
— Жанбулат, Big Data Engineer, KZ
— Ердаулет, Big Data Engineer, FAANG/MANGA
— Целые группы одни скрином: раз и два

🔥 Не упусти свой шанс получить квалификацию международного уровня!

P.S. Продлили донабор на обучение на курсах BigData Team для ребят из регионов через контест по Python до конца выходных (до 04.08, 23:59). За репост - плюс в карму.

P.P.S. Нарвались на баг телеграм, поэтому часть коммуникации в телеграм была утеряна 🙁 —> просьба не забывать проверять почту.

BigData Team: the way your learn best
#work #study #BigDataTeam #TechOrda #AstanaHub


💝 BDMLE, результаты отбора, волна III

Отчитываемся по результатам третьей волны отбора кандидатов по программе:
🚀 Курс BDMLE, Tech Orda, 40+ грантов по 600,000 тенге

В рамках волны III мы отправили предложение на согласование грантов ТОП-10 кандидатам. Всем остальным, днем, мы отправили по почте некоторые уточняющие вопросы и предложение до вечера четверга (до 23:59, 01.08). Если вдруг с вами не связались, просьба проверить спам, написать комментарий к посту или на почту techorda@bigdatateam.org

BigData Team: the way your learn best
#work #study #BigDataTeam #TechOrda #AstanaHub

⬇️ продолжение ⬇️


😜 Термин дня: рекурсия

Пока вы:
1. Ждете результатов тестирования волны III отбора на гранты
2. Решаете задачи из контеста по Python
2. Или ждете новых анонсов BigData Team: Learning Series

Рекомендуем познакомиться или освежить знания по теме рекурсии в картинках.

credit за находку: Денис С.
// выпускник Практического кура по Machine Learning

#meme

20 last posts shown.