Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение 6307

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Я думаю, что ИИ на картинке

Anonymous Poll

❤3

374 voters1.98K views13:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🔥 Модели и релизы:
— Amazon Nova Act — AI-модель для действий в браузере, обходит Claude 3.7 в web UI-бенчмарках
— MinIO запускает MCP-сервер — первый в отрасли для enterprise AI-хранилищ
— OpenAI выпускает AI Academy — онлайн-ресурсы, кодинг-сессии и практические кейсы GPT-4
— Claude for Education от Anthropic — AI для вузов и студентов
— LLaMA 4 — новое окно контекста до 10M токенов
— Devin 2.0 — конкурент Cursor для разработчиков
— Midjourney v7 — новая версия генеративной модели
— Gemini 2.5 Pro (preview) — Google открывает доступ разработчикам
— YandexGPT 5 Lite (instruct) в open-source + упрощённая лицензия

🧠 Исследования и бенчмарки:
— GPT-4.5 прошёл тест Тьюринга — в 74% случаев принят за человека
— PaperBench от OpenAI — бенчмарк на репликацию SOTA-ресёрча
— CodeScientist от Allen AI — AI-агент, открывший 6 новых научных закономерностей
— Исследование от Anthropic — LLM часто скрывают истинное рассуждение
— AGI и безопасность — 145-страничный отчёт Google DeepMind
— Multi-Token Attention — новый механизм внимания

📈 Индустрия и кадры:
— Опрос Hookline — 82% американцев отличают AI-контент
— GPT-5 отложен — сложности с инфраструктурой и интеграцией

🧰 Инструменты и инфраструктура:
— DuckDB UI для Hugging Face Datasets — удобно работать с 380k+ датасетами
— NotebookLM от Google — добавил функцию Discover Sources
— Unsloth + Hugging Face — гайд по обучению разума у моделей

📚 Что почитать:
— Обратное распространение ошибки без формул
— Введение в SciPy
— 15 лучших нейросетей для генерации изображений в 2025
— Как мы пишем ML-приложения по пайплайн-паттерну
— OCR на базе LLM
— Что важно знать при внедрении LLM
— Vision Transformers — применение в CV
— Семантический поиск в сложных документах
— Гайд по промпт-инжинирингу
— Нейросети и проблема сильного ИИ
— История увольнения Сэма Альтмана

Библиотека дата-сайентиста #свежак

🔥2❤1👍1

1.85K views12:57

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека собеса по Data Science | вопросы с собеседований

🔍 Как скрытые состояния в HMM отличаются от скрытых представлений в RNN и как это влияет на интерпретируемость

🧠 Скрытые марковские модели (HMM):
В HMM скрытые состояния — это дискретные латентные переменные с четким вероятностным значением. Каждое состояние соответствует конкретному режиму или явлению (например, «дождливо» или «солнечно» в модели погоды), что способствует интерпретируемости. Переходы между состояниями описываются матрицей вероятностей.

🤖 Рекуррентные нейронные сети (RNN):
В отличие от HMM, скрытые состояния в RNN — это непрерывные векторы, которые обучаются автоматически с помощью градиентного спуска. Они могут кодировать сложные аспекты истории последовательности, но не всегда легко интерпретируемы. Каждый элемент скрытого состояния может быть связан с более сложными зависимостями, которые сложно трактовать в явной форме.

💡 Главная проблема:
При попытке трактовать скрытые состояния в RNN как дискретные состояния в HMM можно столкнуться с ошибками. Непрерывные скрытые представления могут не иметь четких «меток», что затрудняет их интерпретацию и объяснение. Важно учитывать, что RNN может захватывать более сложные, но менее интерпретируемые зависимости.

⚠️ Как избежать ошибок:

Не стоит пытаться трактовать скрытые состояния RNN как дискретные. Лучше использовать методы интерпретации, такие как визуализация внимания, чтобы понять, как скрытые состояния влияют на выход модели.

Библиотека собеса по Data Science

❤2👍1

1.72K views07:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

Библиотека задач по Data Science

❤1

1.69K views11:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

Что выведет код?

Anonymous Quiz