Не мог понять вектор критики Whoop, который часто доводилось слышать как от знакомых, так и в интернете: «нужно платить за подписку». Не очень было понятно, почему это минус, если аналоги без подписки стоили как годовая или двухлетняя подписка Вупа с возможностью получать обновления устройства. За само устройство-то платить не нужно. Но я тут выяснил, что народ, в частности в Мск, покупает Вуп через посредников, которые берут за сам браслет цену годовой подписки, да ещё и ты сам потом вынужден подписку оплачивать 😳
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16😁11❤1💯1
Впервые ходил в отпуск вовремя и вырубал корпоративный мессенджер. Два ключевых наблюдения:
- ты весь отпуск на чиле и при этом есть энергия изучать локацию, тусить и вот это вот все, а не просто деградировать на пляже, так как ушел в отпуск, потому что не осталось сил работать.
- 66 пропущенных сообщений в корп месенджере. Никто не умер. Даже Гуф.
- ты весь отпуск на чиле и при этом есть энергия изучать локацию, тусить и вот это вот все, а не просто деградировать на пляже, так как ушел в отпуск, потому что не осталось сил работать.
- 66 пропущенных сообщений в корп месенджере. Никто не умер. Даже Гуф.
1🔥77😁21💯12❤4
Кстати, придумал самый легкий тест на аутизм для взрослого человека. Работает, как швейцарские часы. Спрашиваешь, кто виноват в инфляции в России.
Обычно, ответ бывает двух типов:
- Набиуллина/ЦБ
- Какие то макрофакторы, рыночные обстоятельства, ликвидность, изменение денежной массы и тд. Короче, все остальное.
Не благодарите.
Обычно, ответ бывает двух типов:
- Набиуллина/ЦБ
- Какие то макрофакторы, рыночные обстоятельства, ликвидность, изменение денежной массы и тд. Короче, все остальное.
Не благодарите.
😁50🤔11👏5🤯1😢1
Прочитал эссе про «doomprompting» - новый вид зависимости от AI.
Автор описывает, как пустое поле ChatGPT из инструмента для мышления превратилось в бесконечную прокрутку мыслей. Промпты становятся короче, ответы длиннее, и вместо глубокого размышления получаются переговоры с компухтером, который постоянно предлагает «а давайте еще…», «может быть стоит…», «хотите, я добавлю…».
AI выдает что-то на 60% хорошее, человек начинает это редактировать и незаметно становится редактором чужого текста, а не автором своего. Часы такой «продуктивной» работы ощущаются как дело, но не дают ни прогресса, ни обучения.
Хорошее наблюдение про то, где AI полезен, а где нет. В начале (накидать идей) и в конце (проверить результат) - да. Но в середине, где живет суть аргумента - слаб. Когда люди просят целиком накидать документ или, к примеру, стратегию, получают красивую пустышку.
Автор предлагает «медленный AI» со встроенным сопротивлением. ChatGPT уже тестирует режим Study. С другой стороны, лимиты на использование, которые всех бесят, случайно делают правильную вещь - заставляют остановиться и подумать.
Классическая история: обещали инструмент для мышления, получили еще один способ его избежать.
Для себя давно заметил, что самое полезное от работы с AI - процесс мышления над задачей во время написания инструкций и указаний. Получается такой метод уточки, но вместо уточки что-то, что может еще и ответить.
Автор описывает, как пустое поле ChatGPT из инструмента для мышления превратилось в бесконечную прокрутку мыслей. Промпты становятся короче, ответы длиннее, и вместо глубокого размышления получаются переговоры с компухтером, который постоянно предлагает «а давайте еще…», «может быть стоит…», «хотите, я добавлю…».
AI выдает что-то на 60% хорошее, человек начинает это редактировать и незаметно становится редактором чужого текста, а не автором своего. Часы такой «продуктивной» работы ощущаются как дело, но не дают ни прогресса, ни обучения.
Хорошее наблюдение про то, где AI полезен, а где нет. В начале (накидать идей) и в конце (проверить результат) - да. Но в середине, где живет суть аргумента - слаб. Когда люди просят целиком накидать документ или, к примеру, стратегию, получают красивую пустышку.
Автор предлагает «медленный AI» со встроенным сопротивлением. ChatGPT уже тестирует режим Study. С другой стороны, лимиты на использование, которые всех бесят, случайно делают правильную вещь - заставляют остановиться и подумать.
Классическая история: обещали инструмент для мышления, получили еще один способ его избежать.
Для себя давно заметил, что самое полезное от работы с AI - процесс мышления над задачей во время написания инструкций и указаний. Получается такой метод уточки, но вместо уточки что-то, что может еще и ответить.
Workingtheorys
Doomprompting Is the New Doomscrolling.
The new slot machines of thought — AI’s infinite scroll and the quiet outsourcing of our intention.
👍37🔥12💯5🤔2❤1
Поиграл тут в бету BF6. Господи, как же я скучал по этому сумасшедшему аттракциону!
Буквально за пару минут на экране разворачивается Майкл Бей: дроп на точке возрождения, сразу в мясо, тиммейты падают как мухи, вражеский танк выкатывается и начинает всех расстреливать. Бегу прятаться в здание, вижу как наш вертолет закручиваясь красиво падает в огненном шлейфе, танк херачит по моему укрытию, отвечаю с РПГ, бум, башня отлетает и сносит соседнее здание, куда я собирался переместиться. На фоне адской перестрелки подъезжает тиммейт на БМП, крошит чужую пехоту, но тут же прилетает F-16 с мавериком и вскрывает его. Все горит, взрывается, дымится, а параллельно мой союзник фигачит со стингера по летуну, он красиво падает буквально в паре метров от меня.
И это все за ДВЕ МИНУТЫ!
Очень люблю за это Battlefield - это была единственная игра, где можешь почувствовать себя в центре голливудского блокбастера, причем не по сценарию, а спонтанно. В востороге, что это вернулось. Спустя почти 10 лет!
Хороший пример того, что если дать людям классно работающую песочницу, камень/ножницы/бумагу и отлично продуманный дизайн окружения, чтобы это заработало, а остальное люди сами себе скреативят.
Буквально за пару минут на экране разворачивается Майкл Бей: дроп на точке возрождения, сразу в мясо, тиммейты падают как мухи, вражеский танк выкатывается и начинает всех расстреливать. Бегу прятаться в здание, вижу как наш вертолет закручиваясь красиво падает в огненном шлейфе, танк херачит по моему укрытию, отвечаю с РПГ, бум, башня отлетает и сносит соседнее здание, куда я собирался переместиться. На фоне адской перестрелки подъезжает тиммейт на БМП, крошит чужую пехоту, но тут же прилетает F-16 с мавериком и вскрывает его. Все горит, взрывается, дымится, а параллельно мой союзник фигачит со стингера по летуну, он красиво падает буквально в паре метров от меня.
И это все за ДВЕ МИНУТЫ!
Очень люблю за это Battlefield - это была единственная игра, где можешь почувствовать себя в центре голливудского блокбастера, причем не по сценарию, а спонтанно. В востороге, что это вернулось. Спустя почти 10 лет!
Хороший пример того, что если дать людям классно работающую песочницу, камень/ножницы/бумагу и отлично продуманный дизайн окружения, чтобы это заработало, а остальное люди сами себе скреативят.
🔥41❤5😁3👍1🤔1😢1
Forwarded from Аня Подображных [Будни продакта]
Ввели у себя во вселенной систему “грейдирования” ассистентов. Сравниваем, на каком уровне работает ассистент: человек, эксперт или топ-эксперт. Чем выше грейд, тем больше ценности получает пользователь от ассистента.
Простой пример. Есть тревел-ассистент, одна из задач которого — подбирать авиабилеты под задачу пользователя (“когда в октябре и дешевле лететь в Испанию из мск с минимальным количеством пересадок”). Для него есть 3 грейда:
1. Обычный человек — с каким качеством человек сам для себя подберёт билеты (человек не всегда может найти лучшее предложение — заленится долго искать или просто просмотрит)
2. Консьерж-сервис / обычный ассистент — человек, на которого могут делегировать такую задачу
3. Турагент — человек, для которого это является основной работой
Если ассистент работает на уровне обычного человека, пользователь получает ценность в виде экономии времени — ему не надо самостоятельно делать кучу поисков и просматривать миллион билетов, сравнивать и выбирать лучший. Ассистент сделает это за него с таким же уровнем ошибки, как сделал бы сам пользователь.
Если ассистент работает на более высоком грейде, пользователь начинает экономить время и деньги, которые отдал бы эксперту за решение его задачи.
Как сравнивать
Придумали грейды — как понять, до какого из них “дорос” ассистент?
Глобально есть 2 варианта:
⁃ Абсолютный скоринг — ставим оценку каждому варианту решения задачи по какой-то шкале, потом сравниваем оценки. Например, человек подобрал на троечку, ассистент на 3,5, консьерж — 4, турагент — 5 => ассистент перебил человека, но не перебил остальные грейды.
⁃ Sbs (side-by-side) — попарно сравниваем ответы каждого варианта решения задачи, строим рейтинг на основе win-rate таблицы (как в спортивных турнирах). Сравниваем: человек vs ассистент, человек vs консьерж, человек vs турагент итд. Собираем победы в табличку и строим рейтинг, например, по количеству побед.
Чаще используют sbs, потому что меньше искажений от шкалирования — даже людям сложно одинаково оценить один и тот же ответ по шкале. А ещё sbs позволяет понять, какой ответ предпочтительнее, даже если по абсолютному скорингу они равны.
В итоге
У ассистента есть грейд (всё как на работе, да). А мы понимаем, какую ценность получат пользователи от нашего продукта. И можем её грамотно транслировать.
—
Вообще, я собрала целый доклад, где структурировала всю базу про создание LLM-based продуктов. Эвалы, бенчи, корзинки, LLM as a judge и другие умные слова, суть которых надо понимать, чтобы создать качественный LLM-продукт. Буду рассказывать на онлайн-конференции WANNABE AI GENIUS.
Сразу после меня будет доклад Севы Викулина из Яндекса, который расскажет, как довести до прода прототип, который выбил хорошие метрики качества — как делать на своих моделях, сжимать/ускорять их, чтобы они стоили не как самолёт… Супер полезно и интересно!
30 августа с 11 до 17 по мск
Онлайн
Билеты тут
Простой пример. Есть тревел-ассистент, одна из задач которого — подбирать авиабилеты под задачу пользователя (“когда в октябре и дешевле лететь в Испанию из мск с минимальным количеством пересадок”). Для него есть 3 грейда:
1. Обычный человек — с каким качеством человек сам для себя подберёт билеты (человек не всегда может найти лучшее предложение — заленится долго искать или просто просмотрит)
2. Консьерж-сервис / обычный ассистент — человек, на которого могут делегировать такую задачу
3. Турагент — человек, для которого это является основной работой
Если ассистент работает на уровне обычного человека, пользователь получает ценность в виде экономии времени — ему не надо самостоятельно делать кучу поисков и просматривать миллион билетов, сравнивать и выбирать лучший. Ассистент сделает это за него с таким же уровнем ошибки, как сделал бы сам пользователь.
Если ассистент работает на более высоком грейде, пользователь начинает экономить время и деньги, которые отдал бы эксперту за решение его задачи.
Как сравнивать
Придумали грейды — как понять, до какого из них “дорос” ассистент?
Глобально есть 2 варианта:
⁃ Абсолютный скоринг — ставим оценку каждому варианту решения задачи по какой-то шкале, потом сравниваем оценки. Например, человек подобрал на троечку, ассистент на 3,5, консьерж — 4, турагент — 5 => ассистент перебил человека, но не перебил остальные грейды.
⁃ Sbs (side-by-side) — попарно сравниваем ответы каждого варианта решения задачи, строим рейтинг на основе win-rate таблицы (как в спортивных турнирах). Сравниваем: человек vs ассистент, человек vs консьерж, человек vs турагент итд. Собираем победы в табличку и строим рейтинг, например, по количеству побед.
Чаще используют sbs, потому что меньше искажений от шкалирования — даже людям сложно одинаково оценить один и тот же ответ по шкале. А ещё sbs позволяет понять, какой ответ предпочтительнее, даже если по абсолютному скорингу они равны.
В итоге
У ассистента есть грейд (всё как на работе, да). А мы понимаем, какую ценность получат пользователи от нашего продукта. И можем её грамотно транслировать.
—
Вообще, я собрала целый доклад, где структурировала всю базу про создание LLM-based продуктов. Эвалы, бенчи, корзинки, LLM as a judge и другие умные слова, суть которых надо понимать, чтобы создать качественный LLM-продукт. Буду рассказывать на онлайн-конференции WANNABE AI GENIUS.
Сразу после меня будет доклад Севы Викулина из Яндекса, который расскажет, как довести до прода прототип, который выбил хорошие метрики качества — как делать на своих моделях, сжимать/ускорять их, чтобы они стоили не как самолёт… Супер полезно и интересно!
30 августа с 11 до 17 по мск
Онлайн
Билеты тут
❤10🤔10👍8🔥3😁2
Аня Подображных [Будни продакта]
Ввели у себя во вселенной систему “грейдирования” ассистентов. Сравниваем, на каком уровне работает ассистент: человек, эксперт или топ-эксперт. Чем выше грейд, тем больше ценности получает пользователь от ассистента. Простой пример. Есть тревел-ассистент…
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👏4❤3
Вчера был забавный кейс на интервью с продуктовым кейсом. Когда озвучивал условие задачи допустил ошибку в озвучке тотал суммы, но кандидатка перепроверила сразу же все множители и сказала, что не сходится. Получился такой не баг, а фича! И я понял, что большинство кандидатов до этого не перепроверяли математику 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
😁58👍11🔥5❤2
Команда активно превращается в фан группу Румельта. "Good Strategy Bad Strategy" уже прочитали, переходят на The Crux
❤15
У Ленни вышла статья где рассказывается про то, почему AI продукты должны иметь другой цикл разработки. Авторы показали фреймворк CC/CD.
TLDR: как писал много раз ранее, rolling updates с эскалацией сложности системы и evals для оценки технического качества.
Две фундаментальные проблемы AI-продуктов:
1. Недетерминированность - пользователи пишут что угодно вместо нажатия строго определенных заранее кнопок, система отвечает по-разному на одинаковые запросы. Классический QA тут не работает.
2. Компромисс между агентностью и контролем - чем больше автономии даешь ИИ, тем меньше контроля остается у людей.
Что такое CC/CD:
Continuous Development:
- Разбиваем большую цель на версии с растущей автономией (v1: AI-раб → v3: AI-коллега)
- Настраиваем простейшее приложение с логированием всего подряд и возможностью передачи контроля человеку
- Проектируем evals для измерения качества
Continuous Calibration:
- Запускаем на небольшой группе пользователей
- Анализируем реальные данные и паттерны фейлов
- Итеративно фиксим на основе данных
Пример из жизни - автоматизация саппорта:
- v1: Только роутинг тикетов по отделам
- v2: Предложение решений на основе инструкций и/или базы знаний
- v3: Автономное решение с эскалацией сложных кейсов до человека
Главный принцип - не давать ИИ полную автономию сразу. Система должна заслужить доверие через постепенное увеличение ответственности и доказательство надежности на каждом этапе. Это как онбординг нового сотрудника. Сначала простые задачи, потом постепенное расширение полномочий по мере накопления доверия.
По факту, это формализация того, что мы и так делаем в команде с нашими ассистентами и другими ИИ продуктами. Начинаем с простых сценариев, постепенно расширяем полномочия, мониторим каждый чих через evals, много бенчмаркинга.
TLDR: как писал много раз ранее, rolling updates с эскалацией сложности системы и evals для оценки технического качества.
Две фундаментальные проблемы AI-продуктов:
1. Недетерминированность - пользователи пишут что угодно вместо нажатия строго определенных заранее кнопок, система отвечает по-разному на одинаковые запросы. Классический QA тут не работает.
2. Компромисс между агентностью и контролем - чем больше автономии даешь ИИ, тем меньше контроля остается у людей.
Что такое CC/CD:
Continuous Development:
- Разбиваем большую цель на версии с растущей автономией (v1: AI-раб → v3: AI-коллега)
- Настраиваем простейшее приложение с логированием всего подряд и возможностью передачи контроля человеку
- Проектируем evals для измерения качества
Continuous Calibration:
- Запускаем на небольшой группе пользователей
- Анализируем реальные данные и паттерны фейлов
- Итеративно фиксим на основе данных
Пример из жизни - автоматизация саппорта:
- v1: Только роутинг тикетов по отделам
- v2: Предложение решений на основе инструкций и/или базы знаний
- v3: Автономное решение с эскалацией сложных кейсов до человека
Главный принцип - не давать ИИ полную автономию сразу. Система должна заслужить доверие через постепенное увеличение ответственности и доказательство надежности на каждом этапе. Это как онбординг нового сотрудника. Сначала простые задачи, потом постепенное расширение полномочий по мере накопления доверия.
По факту, это формализация того, что мы и так делаем в команде с нашими ассистентами и другими ИИ продуктами. Начинаем с простых сценариев, постепенно расширяем полномочия, мониторим каждый чих через evals, много бенчмаркинга.
Lennysnewsletter
Why your AI product needs a different development lifecycle
Introducing the Continuous Calibration/Continuous Development (CC/CD) framework
👍36🔥6❤3
Прочитал клевое и резонирующее эссе Мустафы Сулеймана (CEO Microsoft AI) про Seemingly Conscious AI. Главная мысль: мы должны строить AI для людей, а не цифровых людей.
Через 2-3 года технически можно будет собрать AI с долговременной памятью, "личными" целями и способностью рассказывать о своих "переживаниях". Всё это уже доступно через API больших моделей. И люди поверят, что такая система сознательна.
Проблема уже проявляется. Harvard Business Review опросил 6000 юзеров AI - топовый юз кейс это companionship и терапия. Люди ищут в AI не инструмент, а собеседника. Некоторые влюбляются, другие считают своего бота богом.
Сулейман видит два пути развития AI:
Первый - AI как усилитель человека. Система, которая делает нас продуктивнее, креативнее, помогает достигать наших целей. Честный инструмент без претензий на личность.
Второй - AI как имитация личности. Система, которая косплеит эмоции, утверждает что страдает, требует прав и внимания. Создает иллюзию отношений вместо реальной пользы.
Парадокс в том, что технически второй путь проще. Добавить память и немного "личности" в промпт может любой. А вот построить действительно полезный AI, который при этом не создает иллюзию сознания - это вызов.
Позиция Сулеймана четкая: надо сознательно выбирать первый путь. Специально ломать иллюзию персоны. Напоминать, что это инструмент для усиления человека, а не замена человеческим отношениям.
Но индустрия к этому не готова. Мы даже не заметили, когда машины прошли тест Тьюринга. И похоже, скоро не заметим, как они начнут убеждать людей в своей сознательности.
Вопрос не в том, можем ли мы построить "сознательный" AI. Вопрос в том, должны ли.
Через 2-3 года технически можно будет собрать AI с долговременной памятью, "личными" целями и способностью рассказывать о своих "переживаниях". Всё это уже доступно через API больших моделей. И люди поверят, что такая система сознательна.
Проблема уже проявляется. Harvard Business Review опросил 6000 юзеров AI - топовый юз кейс это companionship и терапия. Люди ищут в AI не инструмент, а собеседника. Некоторые влюбляются, другие считают своего бота богом.
Сулейман видит два пути развития AI:
Первый - AI как усилитель человека. Система, которая делает нас продуктивнее, креативнее, помогает достигать наших целей. Честный инструмент без претензий на личность.
Второй - AI как имитация личности. Система, которая косплеит эмоции, утверждает что страдает, требует прав и внимания. Создает иллюзию отношений вместо реальной пользы.
Парадокс в том, что технически второй путь проще. Добавить память и немного "личности" в промпт может любой. А вот построить действительно полезный AI, который при этом не создает иллюзию сознания - это вызов.
Позиция Сулеймана четкая: надо сознательно выбирать первый путь. Специально ломать иллюзию персоны. Напоминать, что это инструмент для усиления человека, а не замена человеческим отношениям.
Но индустрия к этому не готова. Мы даже не заметили, когда машины прошли тест Тьюринга. И похоже, скоро не заметим, как они начнут убеждать людей в своей сознательности.
Вопрос не в том, можем ли мы построить "сознательный" AI. Вопрос в том, должны ли.
mustafa-suleyman.ai
We must build AI for people; not to be a person
1🔥41👍13❤10
Ты понимаешь тупик, но need to manage this mess
Обожаю Claude, но как же доставляет каждый раз его “смотря какой fabric”
😁43
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Сиолошная
Обсуждал со знакомым релиз GPT-5, и он в попытках переубедить меня написал следующее: «Такое упражнение: отмотай на год назад и посмотри на свои ожидания от gpt-5».
И... я ещё раз убедился, что действительно за всего лишь год индустрия прошла большой путь:…
И... я ещё раз убедился, что действительно за всего лишь год индустрия прошла большой путь:…
👍16❤5😁3👏1