Когда у инструмента больше 10 000 звёзд на GitHub, доказывать его состоятельность уже не нужно.
А вот рассказать об опыте его применения полезно — и сегодня открываем такую запись: https://t.co/x2TuFQGcDc
На SmartData было два доклада про Snowplow: один в формате «введения в тему», а этот — уже о конкретном опыте использования в «Детском мире».
Напрашивается шутка, что мир-то детский, а вот доклад — нет: https://t.co/TipuYzi3LA
Одни люди при слове «Lineage» вспоминают MMORPG-игру, другие — Android-дистрибутив.
А третьи уже посмотрели этот доклад, и им теперь интересннее Data Lineage: https://t.co/cks75FGsZ6
Этот доклад про предварительную фильтрацию информации получил отличные отзывы.
Видимо, на конференции хорошо сработала своя «предварительная фильтрация информации» в виде Программного комитета, отбирающего доклады: https://t.co/0XUBRsyeDR
Бывает интереснее слушать доклад, когда кроме самого выступления, есть ещё и соответствующий репозиторий в опенсорсе.
Сегодня от��рываем как раз такую запись: https://t.co/hHhZdmrzWH
Сталкивались ли вы с болью, когда данных стало так много, что в них уже плохо получается ориентироваться?
Сегодня открываем запись доклада о том, что с этим делать: https://t.co/CG8j5mDClp
Начинаем постепенно публиковать записи осенней SmartData.
И зайдём с козырей: доклада, который на конференции смотрели больше всего: https://t.co/Gnfcae9MU2
Обсуждения продолжаются — �� залах, в дискуссионках, в коридорах… Присоединяйтесь!
А передохнуть от профессиональных дискуссий можно на стендах партнеров — там тоже оживленно.
Делитесь своими фото и впечатлениями от конференции в комментариях
Первый день SmartData 2024 подошел к концу. Записи докладов доступны на сайте.
Спасибо всем участникам! До встречи на офлайне в Москве уже в ближайшее воскресенье — 8 сентября.
SmartData 2024 уже вот-вот начнется!
Сохраняйте расписание, чтобы ничего не пропустить: https://t.co/KESVuYFVq6
Ждем вас на сайте в 11:00: https://t.co/SHrVoBgmLy
SmartData 2024 стартует 4 сентября онлайн. В этот день часть докладов любой сможет посмотреть бесплатно. Достаточно зарегистрироваться.
Подробнее — в нашем посте в Telegram: https://t.co/G7stlXGUUW
Никита Юрасов и Леонид Кожинов расскажут о библиотеке, которая позволяет интегрировать dbt и Airflow.
В докладе — об устройстве библиотеки, ее конкурентах и задачах, которые она поможет решить: https://t.co/gLHmsQq2dC
Новая SmartData уже совсем скоро — а мы тем временем опубликовали все записи старой!
Раньше открывали их здесь постепенно, а теперь можете увидеть общий плейлист со всеми сразу: https://t.co/vW9V0RSHFd
Шри Вишну Чандерраю расскажет про ангиограмму данных — метод, который позволит провести сквозное санитарное тестирование конвейера данных и проверить качество данных.
Технологии: GitLab Pipelines, GitHub Actions, Docker, JUnit, pytest и другие: https://t.co/vvOKvxtsMU
До SmartData 2024 — неделя!
Кроме докладов, вас ждут интервью, круглый стол, обсуждение и Lightning Talks. Под��обнее: https://t.co/N0ZlTLv2n9
Еще будут жаркие дискусси��, нетворкинг, розыгрыши от партнеров и афтерпати с коллегами по цеху.
Купить билеты: https://t.co/wfcbBj4Tek
Павел Солодовников расскажет о библиотеке ускорения баз данных C++.
В докладе — об истории движка, конкурирующих решениях, интероперабельности с другими системами через Apache Arrow и Substrait и расширяемости библиотеки: https://t.co/wIOhXypatl
Алсу Нурутдинова и Алина Кочева на примере чат-бота для технической поддержки расскажут о подходе RAG (Retrieval Augmented Generation).
С ним языковая модель может давать ответы на основе текстов, которые не были видны при обучении, но есть в базе данных: https://t.co/CsHR8An4XH
Александр Мадумаров расскажет, как разработать инструмент для автоматизации data quality, который можно быстро внедрить в любое хранилище данных: https://t.co/PMyqv9mngH
Александр Казанский, head SRE платформы данных Т-Банка, расскажет про систему хранения данных Ceph: какие у нее ключевые функции и почему ее стоит выбрать д��я реализации лейка on-prem.
Подробности: https://t.co/vzpp83IVwi