Telegram Web
Andrej Karpathy: Software Is Changing (Again) (Рубрика #AI)

Посмотрел утром очень интересное и свежеее выступление Andrej Karpathy, одного из основателей OpenAI (2015-2017), директора по ИИ в Tesla (2017-2022). Андрей поделился концепцией Software 3.0 и рассказал про предыдущие этапы развития софтостроения, а также сделал предсказания о том, что ждет нас дальше. Выступление состоялось 16-17 июня 2025 года на первой в истории AI Startup School от Y Combinator в Сан-Франциско. Это было масштабное мероприятие, собравшее 2500 лучших студентов и стартаперов из области компьютерных наук и ИИ. В числе других спикеров выступили Elon Musk, Sam Altman, Andrew Ng и другие лидеры AI-индустрии. Ну а теперь к ключевым идеям выступления.

Эры software

Андрей выделил три эры разработки софта
- Software 1.0 - это традиционный код, написанный программистами
- Software 2.0 - это нейронные сети и их веса
- Software 3.0 - это промпты на английском языке как программы для LLM
В софте 3.0 случилась революция - мы теперь программируем компьютеры на английском языке. Это делает программирование доступным каждому, кто владеет естественным языком (кажется в 1С эта революция давно произошла, только там программировали на русском ✌️)

LLM как новая операционная система
Андрей провел интересную параллель между LLM и операционными системами
- LLM - это CPU, то есть основной вычислительный блок новой парадигмы
- Контекстное окно - это RAM (рабочая память системы)
- Централизация в облаке - из-за высокой стоимости вычислений, что напоминает эру мейнфреймов
- Разделение времени использования - пакетная обработка запросов пользователей
В общем, пока момент PC (personal computers) еще не настал

Психология LLM
Андрей поразмышлял о психологии и привел метаформу "people spirits" по отношению к LLM
- Это стохастические симуляции людей, обученные на человеческих данных
- Они обладают энциклопедическими знаниями и сверхчеловеческими способностями в некоторых областях
- Имеют когнитивные нарушения и ошибки, подобно персонажам из фильмов "Человек дождя", "Помни", "50 первых поцелуев"
- Требуют понимания их ограничений для продуктивного сотрудничества

Основные возможности для разработчиков продуктов
1. Продукты с частичной автономией
Karpathy подчёркивает важность создания приложений с "ползунком автономности", например, в Cursor можно просто пользоваться автодополнением или попросить агента переписать тебе код. В этом плане для работы и аудита AI системы важен правильный GUI (просто чата скорее всего не достаточно). Важно контролировать избыточную активность AI и держать его на поводке
2. Vibe Coding
Karpathy популяризировал термин "vibe coding" — создание приложений через естественные описания без глубокого знания языков программирования. Это приводит к
- Демократизации разработки софта
- Возможности создавать рабочие прототипы за часы вместо недель
- Но приносит сложности с интеграцией и развёртыванием реальных продуктов
3. Создание для агентов
LLM становятся новой категорией потребителей цифровой информации наряду с людьми и программами. Это приводит к следующим последствиям
- Необходимо адаптировать документацию для LLM (переход на Markdown)
- Можно заменить мануалы вида "нажмите на кнопку" на мануалы вида сделайте API-вызов
- Распространению инструментов типа MCP от Anthropic или A2A от Google для прямого общения с агентами

Напоследок Андрей дает рекомендации
- Изучайте все три парадигмы: Software 1.0, 2.0 и 3.0 будут сосуществовать
- Фокусируйтесь на частичной автономии: не стройте полностью автономных агентов, а создавайте "костюмы Железного человека"
- Ускоряйте цикл генерация-верификация: используйте GUI для быстрого аудита работы ИИ
- Готовьте инфраструктуру для агентов: делайте ваши продукты доступными для LLM

По словам Андрея, мы находимся в уникальный момент истории программирования — "предстоит переписать огромное количество кода". Это создаёт беспрецедентные возможности для новых разработчиков войти в индустрию и принять участие в создании софта 3.0

#AI #PlatformEngineering #Engineering #Software #Processes #Productivity
Please open Telegram to view this post
VIEW IN TELEGRAM
Дискуссия на Conversations.AI "RnD на стероидах: автономные агенты с суперпамятью, вызовы vibe coding и новая эра кибербезопасности"(Рубрика #AI)

На следующей неделе буду на конференции Conversations.AI в Питере, где 27 июня в 13.40 буду участвовать в дикусиии относительно передовых возможнстей AI в разработке. В обсуждении будут участвовать уважаемые джентельмены, приведенные ниже
- Сергей Марков, популяризатор науки, директор по развитию технологий искусственного интеллекта SberAI
- Олег Королев, руководитель разработки AI Lab Авито
- Евгений Кокуйкин, сооснователь Raft и CEO HiveTrace
- Александр Поломодов, технический директор Т-Банк
Вести дискуссию будет Илья Карев, Team Lead GenAI Solutions, Just AI.

Мне кажется, что дискуссия получится топовой, поэтому, если будете на конфе, то приходите ее послушать.

#AI #PlatformEngineering #Engineering #Software #Processes #Productivity
Открытие набора в Т-Академию (Рубрика #Edu) 🚀

Отрылся набор в Т-Академию, где есть 4 трека: backend, frontend и android разработка а также продуктовая аналитика. Эта академия позволяет получить глубокое погружение в промышленную разработку с изучением современных языков программирования или подходов продуктовой аналитик (метрики, a/b эксперименты, SQL для анализа данных). Программа длится год или полтора (в зависимости от направления) и строится так, чтобы ее можно было совмещать с работой или учебой.

Преимущества программы
- Лекции от экспертов — ведущие специалисты Т‑Банка
- Практические семинары с разбором реальных кейсов из индустрии
- Персональное код-ревью от опытных разработчиков
- Командные проекты с возможностью попробовать разные роли

Подать заявку можно до 31 июля. Все подробности на сайте

#Edu #Software #Engineering
Эволюция SRE: внедрение AI-ассистента в Т-Банке (Рубрика #SRE)

Посмотрел интересное выступление своего коллеги, Ивана Юрченко, руководителя FineDog Growth в Т-Банке, который занимается развитием платформы инцидент-менеджмента FineDog, которая помогает банку оперативно выявлять сбои в работе сервисов и сокращать время их устранения. Этот доклад был представлен в рамках конференции Platform Engineering Night и он посвящен внедрению AI-ассистентов в работу инженеров по надежности.

Кстати, про три доклада с Platform Engineering Night я уже рассказывал:
- "AI и Platform Engineering" от Игоря Маслова (VP T-Bank at T-Bank)
- "Разработка собственного AI-ассистента для кода: спринт или марафон?" от Дениса Артюшина (tech product & engineer at T-Bank)
- "AI-помощники при работе с кодом. Взгляд в будущее" от Евгения Колесникова (tech product at Yandex)

Дальше расскажу про основные идеи доклада Ивана.

1. Эволюция инструментов инцидент-менеджмента
Иван представил концепцию трехуровневого развития инструментов для работы с инцидентами
- Платформизация — объединение разрозненных инструментов в единую экосистему для более эффективного управления инцидентами
- Автоматизация — упрощение рутинных действий, что позволяет сократить время реакции на инциденты
- Роботизация — автоматизация принятия решений с использованием AI
2. Жизненный цикл инцидента и роль AI
Иван подробно описал этапы работы с инцидентом: детекция, работа с инцидентом и пост-анализ. Особое внимание уделил важности сбора контекста для эффективного решения проблем. А AI-ассистент сейчас интегрируется во все этапы этого цикла, помогая не только реагировать на инциденты, но и предсказывать их, анализировать логи и предлагать варианты решения до начала критической ситуации.
3. Инновационные проекты на базе AI
Основные проекты, про которые рассказал Иван следующие
- Summarizer - система для агрегации информации и автоматической генерации пост-анализов инцидентов. Использует AI для улучшения качества аналитики и выявления закономерностей в инцидентах
- LogAnalyzer - продвинутый инструмент для анализа логов и поиска связанных инцидентов. Применяет кластеризацию логов для выделения аномалий. Выглядит это примерно так
-- Логи скачиваются из Sage (observability платформы) каждые 5 минут
-- Дальше происходит предобработка текста и сегментация на фрагменты
-- Потом векторизация с помощью TF-IDF и трансформеров
-- В финале данные визуализацируются в трехмерном пространстве для наглядного представления аномалий
4. SRE ассистент и его возможности
Иван представил AI-ассистента, разработанного для поддержки SRE-команд, который обладает следующими возможностями
- Интеграция с корпоративным мессенджером Time для удобного доступа
- Взаимодействие с различными ботами и LLM-агентами
- Выполняет ключевые сценарии:
-- Работа с инцидентами и генерация пост-анализов
-- Получение информации из базы данных
-- Поиск по базе знаний с использованием RAG-платформы
-- Управление дежурствами через мессенджер
5. Метрики и оценка эффективности AI-ассистента

Иван рассказал про ключевые метрики: качество ответа, полнота, галлюцинации, ошибки периодов. Оценки на основе ручной разметки около 600 запросов получились такие
- Precision: 0.54
- Recall: 0.43
Для LogAnalyzer результаты были такие
- Precision: 0.64
- Recall: 0.85
6. Перспективы развития
В заключительной части выступления Иван обозначил планы на будущее
- Запуск новых итераций SRE-ассистента с улучшенными возможностями
- Дальнейшее совершенствование метрик и интеграция системы обнаружения аномалий
- Постоянный поиск новых идей и обмен опытом с профессиональным сообществом

В общем, доклад мне понравился - интересный баланс общей теории и деталей о конкретных сценариях, которые мы пытаемся AI'фицироватьь для наших SRE инженеров.

P.S.
Если тема показалась интересной, то можно еще почитать мой обзор статьи про общие процессы вокруг надежности в Т-Банке, которую написал Леша Мерсон, ex-dev advocate платформы Sage.

#AI #SRE #SystemDesign #Software #Architecture #Metrics #SoftwareArchitecture #Engineering
[1/2] Статьи из серии "Developer Productivity for Humans" (Рубрика #Management)

Я решил сделать общий пост про статьи из сериии про продуктивность инженеров от Google. Эта мысль пришла после недавнего рассказа про "Measuring Productivity: All Models are Wrong But Some are Useful", в которой авторы обощают свои подходы и принципы для построения моделей продуктивности. Ниже список статей из этой серии, про которые я уже рассказывал

1) A Human-Centered Approach to Developer Productivity. Эта статья начинала серию и в ней авторы описывали почему они смотрят на вопрос продуктивности инженеров не только с точки зрения процесса и техники, а еще с точки зрения людей, что в нем участвуют. Здесь они вспоминают научный менеджмент Тейлора (про эффективность работы у конвейера) и показывают почему сейчас в разработке нужны подходы чуть сложнее:) Подробный разбор в блоге
2) Enabling the Study of Software Development Behavior With Cross-Tool Logs. Статья 2020 года, где авторы из Google рассказали про создание своей системы InSession, которая позволяет проводить комплексный анализ поведения инженеров путем интеграции логов от множества инструментов разработки. Подробный разбор есть в отдельном посте в tg
3) Measuring Developer Experience With a Longitudinal Survey. Рассказ про долговременные исследования в виде опросов, что поводятся с 2018 года. Опросы являются одной из опор для сбора информации о продуктивности, наряду с логами. Авторы делятся инсайтами о том, как выстроить такую программу у себя в компании и что она позволяет измерять. Разбор есть в отдельном посте в tg, а также мы разбирали этот whitepaper в 10 эпизоде подкаста Research Insights Made Simple с Артемом Арюткиным
4) Measuring Developer Goals. В этой статье исследователи рассказывали о том, что понимание и эффективное измерение целей критически важно для улучшения опыта разработчиков и повышения их эффективности. Для ответа на вопросы о продуктивности удобнее привязывать измерения не к конкретным инструментам, а к тем целям, которые разработчики ставят перед собой при использовании инструментов. Это позволяет отвечать на вопросы, похожие на те, что приведены выше, сохраняя метрики ориентированными на пользователя, а не инструмент. Подробный разбор в блоге, а также есть восьмая серия подкаста Research Insights Made Simple, где мы разбирали эту статью с Сашей Кусургашевым, моим коллегой, что руководит разработкой Spirit (наша внутренняя платформа разработки)
5) What Do Developers Want From AI?. Здесь авторы говорят о том, что эволюция AI - это поворотный момент, но с технологическими революциями, что меняют формат работы людей, человечество сталкивается не в первый раз. Поэтому авторы статьи решают провести параллели между AIфикацией и развитием автомобильной промышленности и сфокусироваться на потребностях и целях наших разработчиков. Разбор есть в отдельном посте в tg, а также мы разбирали эту статью в девятом выпуске Research Insights Made Simple с Колей Бушковым, моим коллегой из RnD центра.
6) Software Quality. Крутая статья, где авторы обсуждают холистический подход к измерению продуктивности надо обращать внимание на speed, ease и quality для того, чтобы не получить кратковременные улучшения за счет долговременного негативного влияния. А дальше ребята фокусируются на теме качества, которая затрагивает процессы, код, систему и продукт целиком. Мне эта тема очень близка, так как она очень тесно пересекается с архитектурой и архитектурными характеристиками:) Подробный разбор в блоге
7) Defining, Measuring, and Managing Technical Debt. Интересное обсуждение концепции технического долга, а также пример того, как его измеряли в Google и ккак с ним боролись с хорошими результатами. Подробный разбор есть у меня в блоге, а также мы разбирали этот whitepaper вместе с Димой Гаевским во второй серии подкаста "Research Insights Made Simple

Окончание рассказа про статьи из этой серии в следующем посте.

#Engineering #Software #Bigtech #Productivity #Management #Leadership #Processes
Code of Leadership #42 Interview with Andrew Romanovsky about Сareer as aт engineering manager (Рубрика #Management)

В эту среду в 19.00 пройдет live интервью с Андреем Романовским о карьере engineering manager в крупной технологической компании. Андрей руководит продуктовой разработкой Яндекс.Лавки и является CTO Yango.Tech Retail, а кроме того ведет канал Lead’s Notes (@leadsnotes). Мы обсудим вопросы в стиле как дорасти до c-level позиции, заработать свой первый миллион и не сойти с ума, как адаптироваться к росту размера команды и сложности зоны ответственности. Например, мы обсудим
- Что входет в роль engineering manager?
- Ради чего вообще стоит идти в менеджерский карьерный трек?
- Как устроен рост менеджера?
- Растет ли сложность работы с продвижением по карьерной лестнице?
- Как решать проблемы тайм-менеджмента: перегруз, баланс работы и личной жизни?
- Как не потерять технические скиллы и стоит ли за этим гнаться?

В общем, приходите на трансляцию и задавайте дополнительные вопросы, на которые мы постараемся ответить.

#Software #Engineering #Management #Architecture #Processes
[2/2] Статьи из серии "Developer Productivity for Humans" (Рубрика #Management)

Продолжая рассказ про статьи из этой серии поделюсь разборами оставшихся статей.

8 ) Build Latency, Predictability, and Developer Productivity. Очень интересная статья с описанием того, как была поставлена задача исследователям насчет важности ускорения билдов. Они описывают как они определяли tradeoff между стоимость инфры и бенефитами ускорения, а в итоге поняли, что важна не только скорость, но и предсказуемость сборки для того, чтобы инженеры могли планировать свою работу. Подробный разбор в блоге.
9 ) Hybrid Productivity. Здесь авторы разбирают достаточно холиварную тему продуктивности работы в офисе и удаленной работы. Они показывают в своем исследовании как они это измеряли, а также делятся выводами. Например, из работы видно, что гибридная работа во время ковида приводила к проблемам с онбордингом новых сотрудников по сравнению с офисной работой до ковида. Подробный разбор в блоге
10) Onboarding and Ramp-Up. Статья про то, как ребята измеряли эффективность онбординга, какие метрики использовали. Частично пересекается со второй статьей про гибридную работу, так как разбирается тот же кейс про скорость и качество онбординга во время COVID-19. Подробный разбор отдельном посте в tg
11) Measuring Flow, Focus, and Friction for Developers. Эта статья про человеческую сторону продуктивности, а точнее про восприятие инженеров двух концепций: flow и friction. Для этого авторы проводили опросы и просили инженеров вести дневники, а дальше они матчили эти данные с логами от инструментов, что использовали инженеры. В итоге, у исследователей получилось создать эвристики для трансформации сигналов из логов в метрики, что значимо связаны с flow, focus и friction. Подробный разбор в отдельном посте в tg.
12) Creativity in Software Engineering. Авторы разбирали что такое креативность в разработке, оказалось, что это умное переиспользование, а не полная новизна, как принято в других сферах. Кроме того, это качество присуще крутым инженерам. А дальше они постарались сопоставить креативность и продуктивность и выдвинули гипотезу, что что продуктивность - это про ближайшее время, а креативность про долговременный эффект от качественного кода. Подробный разбор в отдельном посте в tg
13) Measuring Productivity: All Models are Wrong But Some are Useful. Обобщающая работа, где авторы рассказали про принципы и методики, что выработали в Google для преодоления ограничений моделей и получения ценных инсайтов. Разбор есть в отдельном посте в tg

#Engineering #Software #Bigtech #Productivity #Management #Leadership #Processes
Elon Musk: Digital Superintelligence, Multiplanetary Life, How to Be Useful (Рубрика #Management)

Посмотрел интересное выступление Илона Маска на конференции AI Startup School от Y Combinator в Сан-Франциско, что проходила 16-17 июня 2025 года и было приурочено к запуску новой образовательной программы YC для молодых разработчиков и исследователей ИИ. Илон делился своим опытом и рассказал молодым стартаперам и ученым о том, как он начинал свой путь на заре создания интернета, создав Zip2 и участвуя в развитии PayPal, а потом перешел к революционным проектам в области космических технологий и искусственного интеллекта. Ниже я опишу основные идеи выступления

1. First principles thinking
Макс много говорил про мышление с опорой на базовые принципы, которое должно быть главным инструментом разработчиков. Он подчеркивает важность разложения сложных задач на фундаментальные элементы и построения решений снизу вверх, а не по аналогии с существующими подходами. Он предпочитает термин "инженерия" вместо "исследования", акцентируя внимание на практическом применении. В своей презентации Маск рассказывает много примеров такого мышления в рамках задач SpaceX, xAI и остальных своих компаний
2. Фокус на полезности
Главный совет для разработчиков — стремиться быть максимально полезными для как можно большего числа людей. Маск подчеркивает важность создания продуктов, которые решают реальные проблемы, а не просто впечатляют технически.
3. Управление эго и обратная связь
Критически важно поддерживать низкое соотношение эго к способностям. Высокое эго разрывает петлю обратной связи с реальностью, что особенно опасно в разработке, где код и физические законы являются строгими судьями. Я это для себя перевел как оставаться поближе к реальности и не уходить в мечты и самовозвеличивание (иногда такое бывает с достигшими значимого успеха)
4. Взгляд на будущее ИИ
Маск прогнозирует появление цифрового сверхразума уже в ближайшие 1-2 года. Для разработчиков ИИ он подчеркивает критическую важность создания систем, максимально приверженных истине, даже если эта истина политически некорректна.
5. Масштабирование инфраструктуры
На примере создания тренировочного кластера для xAI с 100,000 GPU Маск демонстрирует подход first principles thinking к решению сложных инженерных задач. Ключ — разбить проблему на составные части (здание, энергия, охлаждение, сетевое оборудование) и решать каждую отдельно.
6. Долгосрочное видение
Маск призывает разработчиков думать о долгосрочном воздействии своей работы на человечество. Он видит текущий момент как начало "большого взрыва AI" и подчеркивает роль технологий в обеспечении выживания и процветания цивилизации. Забавно, что во время выступления Макс вспоминал как выглядел "большой взрыв интернета" и проводил параллели с текущими событиями
7. Практические советы для стартапов
Макс дал советы следующие
- Не отдавайте контроль над советом директоров устаревшим компаниям
- Идите напрямую к потребителям, минуя посредников
- Будьте готовы к неудачам — первые три запуска Falcon 1 провалились
- Инвестируйте практически все обратно в развитие технологий

В конце Макс почти перешел к технопроповеди и призвал присоедяться к созданию технологий, которые помогут понять природу Вселенной и обеспечить будущее человечества как мультипланетарного вида.

#AI #Engineering #Management #Leadership
...Isms. Understanding Modern Art (...Измы. Как понимать фотографию) (Рубрика #Culture)

За неделю неспешного чтения изучил книгу Эммы Льюис 2017 года о том, как понимать фотографию. Эмма - британский куратор и историк фотографии, которая работала на момент написания книги в качестве ассистента куратора международного искусства в галерее Tate Modern в Лондоне, где она занимается фотографическими приобретениями и курирует выставки. Эмма структурировала свою книгу хронологически, выделив пять основных периодов развития фотографии:

Часть 1: Изобретение фотографии и документация мира (1826 — 1910)
Эта часть охватывает самые ранние этапы развития фотографии, от изобретения фотографического процесса до начала XX века.
Часть 2: В сторону модернизма (1850 — 1930)
Этот период охватывает раннее развитие фотографии и включает зарождение различных направлений. В рамках этой эпохи особое внимание уделяется пикториализму — движению, которое стремилось доказать, что фотография может быть искусством, подражая живописи. Значительную роль в развитии пикториализма сыграли такие фотографы, как Альфред Стиглиц и группа «Фото-Сецессион».
Часть 3: Общество и человечество (1930 — 1970)
Эта эпоха знаменита развитием уличной фотографии и документальной съемки. Ключевыми фигурами стали Эжен Атже, который создал тысячи фотографий старого Парижа между 1890 и 1928 годами, а также американские фотографы Уокер Эванс и Хелен Левитт.
Часть 4: Постмодернизм (1950 — 1990)
Этот период включал эксперименты с формой и содержанием, отход от традиционных представлений о фотографии.
Часть 5: Современная фотография (1980 — 2010)
Это была эпоха цифровой фотографии и социальных медиа, включая период «от изобретения фотографического процесса до пост-интернет эры.

Если бы Эмма писала книгу сейчас, то она точно бы добавила что-то про текущее разлдолье LMM (large multimodal models), которые позволяют генерировать любые изображения и видео, но книга была написана почти 10 лет назад, когда сгенерированные изображения еще не были настолько хороши.

В общем, книга мне показалсь очень доступным источником знаний для всех, , кто хочет понимать и чувствовать искусство, которое пронизывает всю нашу жизнь. Сама книга написана доступным языком без специального жаргона, но при этом содержит достоверную информацию.

P.S.
Я когда-то увлекался фотографией - с тех пор у меня осталось какое-то количество фоток на 500px, а также любовь к чтению книг на тему фотографии:)

#Culture #Photography
Космонавтика (Рубрика #PopularScience)

В выступлении Илона Маска, про которое я рассыказывал в выходные, мне понравилась часть, где он рассказывал про Space X. Я сам когда-то в детстве мечтал полететь в космос, но потом я вырос и понял, что скорее всего у меня не получится. Но я до сих пор люблю читать про космос, астрофизику, а после поездки в Китай я верулся с космонавтом из набора лего, который теперь стоит на моем столе в офисе. А рядом с ним лежит книга "NASA. The Archive" и "Космические туманности 3D", которые иногда можно полистать для получения вдохновения:)

#PopularScience #Photography
Alexander Wang: Building Scale AI, Transforming Work with Agents & Competing with China (Рубрика #AI)

Посмотрел на выходных очень интересное выступление Александра Вана, американо-китайского предпринимателя, родившийся в 1997 году в Лос-Аламосе, Нью-Мексико. В 24 года он стал самым молодым self-made миллиардером в мире. Ван — математический вундеркинд, который участвовал в олимпиадах по математике и программированию с детства. До основания Scale AI работал программистом в Quora в возрасте 17 лет, а также учился в MIT, откуда ушел для развития своего стартапа. Его компания Scale AI — это платформа для аннотирования данных, предоставляющая обучающие данные для моделей машинного обучения (аля Mechanical Turk от AWS или "Толока" от Яндекса). Александр основал ее совместно с Люси Го в 2016 году в рамках акселератора Y Combinator (Александру тогда было 19). Изначально Scale AI позиционировалась как "API для человеческого труда", но быстро сфокусировалась на данных для беспилотных автомобилей (про это Александр рассказывает подробно в подкасте). Сегодня Scale AI стоит $29 миллиардов после недавних инвестиций Meta в размере $14 миллиардов, а Александр возглавит новую лабораторию суперинтеллекта Meta

Если говорить про основные тезисы выступления, то они следующие
1. Эволюция Scale AI: от данных к агентам
Ван рассказал о трансформации компании от простой платформы разметки данных к провайдеру агентных решений. Компания прошла путь от фокуса на беспилотные автомобили до создания ИИ-приложений стоимостью сотни миллионов долларов для крупнейших корпораций и правительства
2. Будущее работы: люди как менеджеры агентов
Александр Ван представил техно-оптимистичное видение будущего работы. По его мнению, конечное состояние экономики — это "крупномасштабное управление людьми и агентами". Люди будут выполнять роль менеджеров, координирующих работу ИИ-агентов, при этом сохраняя контроль над видением и конечными результатами. Забавно, что техно-пессимисты иногда говорят, что агентами будут люди, а менеджерить их будет AGI:)
3. Конкуренция с Китаем в области ИИ
Ван открыто обсудил вызовы конкуренции с китайскими ИИ-лабораториями. Он отметил, что китайские модели хороши частично благодаря промышленному шпионажу, а Китай имеет преимущества в данных и энергетике. США отстают в производстве энергии из-за регуляторных ограничений, в то время как Китай продолжает наращивать мощности. Ирониично было слушать обсуждение конкуренции с Китаем от Гарри Тена, главы Y Combinator, и Александра Вана, главы Scale AI.
4. "Последний экзамен человечества"
Scale AI создала benchmark под названием "Humanity's Last Exam" — набор сверхсложных научных задач, составленных ведущими исследователями. Эти задачи требуют многочасовых размышлений и никогда не появлялись в учебниках. Лучшие модели уже набирают более 20% баллов, что показывает быстрый прогресс ИИ в решении передовых исследовательских задач
5. Законы масштабирования и специализированные модели
Ван подчеркнул важность законов масштабирования, которые стали очевидными с выходом GPT-3 в 2020 году. В будущем каждая компания будет иметь специализированную модель как основной IP, обученную на собственных данных и для решения конкретных бизнес-задач
6. Агентные рабочие процессы
Scale AI активно использует обучение с подкреплением для автоматизации внутренних процессов, преобразуя человеческие рабочие процессы в агентские. Компания применяет эти решения для анализа данных, отчетов о продажах и других операционных задач.

В общем, интервью достаточно глубокое и интересное, причем видно насколько Александр увлечен своей работой и шарит в теме - не зря Марк Цукерберг вложился в компанию Александра и позвал руководить лабораторией.

#AI #Engineering #Management #Leadership #ML #Software
Turbo ML Conf от Т-Банка (Рубрика #AI)

19 июля Т-Банк проведет масштабную конференцию для специалистов в области машинного обучения — Turbo ML Conf. Это уникальная площадка, где соберутся ведущие эксперты для обсуждения самых актуальных тем и прикладных кейсов в сфере искусственного интеллекта. Участников ждут как доклады, ориентированные на продукт и бизнес-метрики, так и глубокие технические разборы из мира R&D и научных исследований. В программе конференции 5 треков

1. NLP (Обработка естественного языка)
Спикеры поделятся опытом в автоматизации клиентской поддержки, обсудят alignment, reasoning, а также мультимодальные большие языковые модели (LLM) и их механистическую интерпретируемость.
2. Research & RnD
Обсуждение того, как устроены исследования в России и кто создает новые направления. Обсуждение alignment, reasoning, LMM и mechanistic interprebability
3. RecSys (Рекомендательные системы)
Эксперты представят свежие инсайты из промышленных A/B-тестов, расскажут о применении нейросетей на разных этапах создания рекомендательных систем и поделятся опытом построения персонализации в крупных проектах. Также будут затронуты техники улучшения бизнес-метрик и применение графовых нейронных сетей (GNN).
4. CV (Компьютерное зрение) и Speech
Этот трек будет посвящен последним достижениям в области синтеза и распознавания речи, генеративным сетям, VLM (Vision-Language Models) и OCR (оптическое распознавание символов).
5. LLM Applications (Применение LLM)
Этот блок будет посвящен практическому использованию больших языковых моделей. Будут рассмотрены LLM-платформы, архитектура решений, инструментарий (тулинг), агентные системы, RAG (Retrieval-Augmented Generation) и применение LLM в разработке программного обеспечения. Отдельное внимание будет уделено низкоуровневым оптимизациям для работы моделей на различных устройствах.

В общем, регистрируйтесь и приходите послушать крутые доклады.

#AI #ML #Engineering #Software #Conference
2025/06/25 04:24:26
Back to Top
HTML Embed Code: