tgoop.com/zasql_python/331
Last Update:
Материалы для прокачки навыков в Polars для начинающих
Написал я пост про Pandas, теперь напишу про Polars, чтобы было логическое продолжение
Это быстрый, многопоточный, ленивый (в хорошем смысле) и оптимизированный инструмент для работы с таблицами. Используется дата-инженерами и аналитики.
1. Официальная документация – базовые концепции и API docs.pola.rs
2. Подробный гайд по Polars с примерами – разбор синтаксиса и возможностей Polars Book (GitHub)
3. Работа со строками в Polars – как делать обработку текстов, разбирать email-адреса, чистить данные и т.д. Статья на Towards Data Science
4. Шпаргалка в Jupyter Notebook – можно сразу потыкать основные команды Cheat Sheet
5. Шпаргалка в PDF (с визуализацией для лучшего усвоения) - PDF Cheat Sheet
Но стоит отметить, что в индустрии чаще всего используют для работы с большими даннными PySpark. Настройка приложений, различные запросы, ML-методы с PySpark и т. д.
Используете ли вы Polars? Пишите в комментариях
#дляначинающих@zasql_python