THISISDATA Telegram 236
Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест



tgoop.com/thisisdata/236
Create:
Last Update:

Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест

BY This is Data




Share with your friend now:
tgoop.com/thisisdata/236

View MORE
Open in Telegram


Telegram News

Date: |

Hashtags Add up to 50 administrators Telegram users themselves will be able to flag and report potentially false content. The group also hosted discussions on committing arson, Judge Hui said, including setting roadblocks on fire, hurling petrol bombs at police stations and teaching people to make such weapons. The conversation linked to arson went on for two to three months, Hui said. Concise
from us


Telegram This is Data
FROM American