tgoop.com/data_engineerette/98
Last Update:
Недавно ходила на сходку ODS (Open Data Science) и познакомилась с одним дата аналитиком. В общих чертах состоялся такой диалог:
- Чем вы занимаетесь?
- Шатаю таблички.
- И каким образом?
- Да просто select *, и все)
Так вот этот пост про do и don'ts в сфере работы с данными:SELECT *
, а не только нужные поля - вдруг они пригодятся в будущем? И никаких LIMIT
- мы не хотим делать выводы на крошечной выборкеON
, WHERE
и т.д. - лучше сделайте побыстрее и идите отдыхатьOR
, не пытайтесь заменить на IN
, UNION
и т.д.DISTINCT
, он должен быть в каждом подзапросе - для нашей 200% уверенностиUPPER
, LOWER
, LEFT
, RIGHT
... Ну а
WHERE UPPER(name) LIKE '_Mary%'- вообще песня!
_
%