390 - Telegram Web

Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
390 - Telegram Web

Записки C3PO

Не мог понять вектор критики Whoop, который часто доводилось слышать как от знакомых, так и в интернете: «нужно платить за подписку». Не очень было понятно, почему это минус, если аналоги без подписки стоили как годовая или двухлетняя подписка Вупа с возможностью получать обновления устройства. За само устройство-то платить не нужно. Но я тут выяснил, что народ, в частности в Мск, покупает Вуп через посредников, которые берут за сам браслет цену годовой подписки, да ещё и ты сам потом вынужден подписку оплачивать 😳

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16😁11❤1💯1

3.91K views05:48

Записки C3PO

Ну то есть продакты перекрыли входную карьерную воронку для разрабов, что приведет к их скорому вымиранию, как класса. Звучит будто разрабы это герой мема про велосипедиста с палкой в колесе.

😁52👍9👏2😢2💯1

4.34K views19:20

Записки C3PO

Впервые ходил в отпуск вовремя и вырубал корпоративный мессенджер. Два ключевых наблюдения:
- ты весь отпуск на чиле и при этом есть энергия изучать локацию, тусить и вот это вот все, а не просто деградировать на пляже, так как ушел в отпуск, потому что не осталось сил работать.
- 66 пропущенных сообщений в корп месенджере. Никто не умер. Даже Гуф.

1🔥77😁21💯12❤4

3.26K viewsedited 09:50

Записки C3PO

Кстати, придумал самый легкий тест на аутизм для взрослого человека. Работает, как швейцарские часы. Спрашиваешь, кто виноват в инфляции в России.

Обычно, ответ бывает двух типов:
- Набиуллина/ЦБ
- Какие то макрофакторы, рыночные обстоятельства, ликвидность, изменение денежной массы и тд. Короче, все остальное.

Не благодарите.

😁50🤔11👏5🤯1😢1

3.47K views20:21

Записки C3PO

Прочитал эссе про «doomprompting» - новый вид зависимости от AI.

Автор описывает, как пустое поле ChatGPT из инструмента для мышления превратилось в бесконечную прокрутку мыслей. Промпты становятся короче, ответы длиннее, и вместо глубокого размышления получаются переговоры с компухтером, который постоянно предлагает «а давайте еще…», «может быть стоит…», «хотите, я добавлю…».

AI выдает что-то на 60% хорошее, человек начинает это редактировать и незаметно становится редактором чужого текста, а не автором своего. Часы такой «продуктивной» работы ощущаются как дело, но не дают ни прогресса, ни обучения.

Хорошее наблюдение про то, где AI полезен, а где нет. В начале (накидать идей) и в конце (проверить результат) - да. Но в середине, где живет суть аргумента - слаб. Когда люди просят целиком накидать документ или, к примеру, стратегию, получают красивую пустышку.

Автор предлагает «медленный AI» со встроенным сопротивлением. ChatGPT уже тестирует режим Study. С другой стороны, лимиты на использование, которые всех бесят, случайно делают правильную вещь - заставляют остановиться и подумать.

Классическая история: обещали инструмент для мышления, получили еще один способ его избежать.

Для себя давно заметил, что самое полезное от работы с AI - процесс мышления над задачей во время написания инструкций и указаний. Получается такой метод уточки, но вместо уточки что-то, что может еще и ответить.

Doomprompting Is the New Doomscrolling.

The new slot machines of thought — AI’s infinite scroll and the quiet outsourcing of our intention.

👍37🔥12💯5🤔2❤1

3.65K views05:28

Записки C3PO

Поиграл тут в бету BF6. Господи, как же я скучал по этому сумасшедшему аттракциону!

Буквально за пару минут на экране разворачивается Майкл Бей: дроп на точке возрождения, сразу в мясо, тиммейты падают как мухи, вражеский танк выкатывается и начинает всех расстреливать. Бегу прятаться в здание, вижу как наш вертолет закручиваясь красиво падает в огненном шлейфе, танк херачит по моему укрытию, отвечаю с РПГ, бум, башня отлетает и сносит соседнее здание, куда я собирался переместиться. На фоне адской перестрелки подъезжает тиммейт на БМП, крошит чужую пехоту, но тут же прилетает F-16 с мавериком и вскрывает его. Все горит, взрывается, дымится, а параллельно мой союзник фигачит со стингера по летуну, он красиво падает буквально в паре метров от меня.

И это все за ДВЕ МИНУТЫ!

Очень люблю за это Battlefield - это была единственная игра, где можешь почувствовать себя в центре голливудского блокбастера, причем не по сценарию, а спонтанно. В востороге, что это вернулось. Спустя почти 10 лет!

Хороший пример того, что если дать людям классно работающую песочницу, камень/ножницы/бумагу и отлично продуманный дизайн окружения, чтобы это заработало, а остальное люди сами себе скреативят.

🔥41❤5😁3👍1🤔1😢1

3.42K views08:22

Записки C3PO

Сама, где мои бабки за консультацию?
https://www.tgoop.com/seeallochnaya/2764

😁26💯2

3.15K views11:37

Записки C3PO

Записки C3PO

Поиграл тут в бету BF6. Господи, как же я скучал по этому сумасшедшему аттракциону! Буквально за пару минут на экране разворачивается Майкл Бей: дроп на точке возрождения, сразу в мясо, тиммейты падают как мухи, вражеский танк выкатывается и начинает всех…

Простите

https://www.kkinstagram.com/reel/DNJwT93hArA/?igsh=OGhsMWJwdTJkNW02

😁16💯9😢1

3.08K viewsedited 17:59

Записки C3PO

Forwarded from Аня Подображных [Будни продакта]

Ввели у себя во вселенной систему “грейдирования” ассистентов. Сравниваем, на каком уровне работает ассистент: человек, эксперт или топ-эксперт. Чем выше грейд, тем больше ценности получает пользователь от ассистента.

Простой пример. Есть тревел-ассистент, одна из задач которого — подбирать авиабилеты под задачу пользователя (“когда в октябре и дешевле лететь в Испанию из мск с минимальным количеством пересадок”). Для него есть 3 грейда:
1. Обычный человек — с каким качеством человек сам для себя подберёт билеты (человек не всегда может найти лучшее предложение — заленится долго искать или просто просмотрит)
2. Консьерж-сервис / обычный ассистент — человек, на которого могут делегировать такую задачу
3. Турагент — человек, для которого это является основной работой

Если ассистент работает на уровне обычного человека, пользователь получает ценность в виде экономии времени — ему не надо самостоятельно делать кучу поисков и просматривать миллион билетов, сравнивать и выбирать лучший. Ассистент сделает это за него с таким же уровнем ошибки, как сделал бы сам пользователь.

Если ассистент работает на более высоком грейде, пользователь начинает экономить время и деньги, которые отдал бы эксперту за решение его задачи.

Как сравнивать
Придумали грейды — как понять, до какого из них “дорос” ассистент?

Глобально есть 2 варианта:
⁃ Абсолютный скоринг — ставим оценку каждому варианту решения задачи по какой-то шкале, потом сравниваем оценки. Например, человек подобрал на троечку, ассистент на 3,5, консьерж — 4, турагент — 5 => ассистент перебил человека, но не перебил остальные грейды.
⁃ Sbs (side-by-side) — попарно сравниваем ответы каждого варианта решения задачи, строим рейтинг на основе win-rate таблицы (как в спортивных турнирах). Сравниваем: человек vs ассистент, человек vs консьерж, человек vs турагент итд. Собираем победы в табличку и строим рейтинг, например, по количеству побед.

Чаще используют sbs, потому что меньше искажений от шкалирования — даже людям сложно одинаково оценить один и тот же ответ по шкале. А ещё sbs позволяет понять, какой ответ предпочтительнее, даже если по абсолютному скорингу они равны.

В итоге
У ассистента есть грейд (всё как на работе, да). А мы понимаем, какую ценность получат пользователи от нашего продукта. И можем её грамотно транслировать.

—

Вообще, я собрала целый доклад, где структурировала всю базу про создание LLM-based продуктов. Эвалы, бенчи, корзинки, LLM as a judge и другие умные слова, суть которых надо понимать, чтобы создать качественный LLM-продукт. Буду рассказывать на онлайн-конференции WANNABE AI GENIUS.
Сразу после меня будет доклад Севы Викулина из Яндекса, который расскажет, как довести до прода прототип, который выбил хорошие метрики качества — как делать на своих моделях, сжимать/ускорять их, чтобы они стоили не как самолёт… Супер полезно и интересно!

30 августа с 11 до 17 по мск
Онлайн
Билеты тут

❤10🤔10👍8🔥3😁2

3.86K views08:07

Записки C3PO

Аня Подображных [Будни продакта]

Ввели у себя во вселенной систему “грейдирования” ассистентов. Сравниваем, на каком уровне работает ассистент: человек, эксперт или топ-эксперт. Чем выше грейд, тем больше ценности получает пользователь от ассистента. Простой пример. Есть тревел-ассистент…

👆 Аня клево рассказала, как мы во вселенной ассистентов грейдим их способности. Оч хорошо структурирует оценку качества агентов

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👏4❤3

4.21K views09:30

Записки C3PO

Мне кажется, что многое можно сказать о личности по самым юзаемым реакциям в слаке

😁37💯4

4.51K views14:10

Записки C3PO

Вчера был забавный кейс на интервью с продуктовым кейсом. Когда озвучивал условие задачи допустил ошибку в озвучке тотал суммы, но кандидатка перепроверила сразу же все множители и сказала, что не сходится. Получился такой не баг, а фича! И я понял, что большинство кандидатов до этого не перепроверяли математику 🤔

Please open Telegram to view this post

VIEW IN TELEGRAM

😁58👍11🔥5❤2

4.87K views08:34

Записки C3PO

Спросил тут у перплексити, как можно добраться до Фетхие

😁70😎6❤2🤔1

4.54K views16:29

Записки C3PO

Команда активно превращается в фан группу Румельта. "Good Strategy Bad Strategy" уже прочитали, переходят на The Crux

❤15

3.77K views09:12

Записки C3PO

Forwarded from Albina Munirova

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

3.89K views09:12

❤2😎2

Записки C3PO

Скоро мои профессиональные похороны. Все подписчики приглашены

1😁31

3.56K viewsedited 18:19

Записки C3PO

У Ленни вышла статья где рассказывается про то, почему AI продукты должны иметь другой цикл разработки. Авторы показали фреймворк CC/CD.

TLDR: как писал много раз ранее, rolling updates с эскалацией сложности системы и evals для оценки технического качества.

Две фундаментальные проблемы AI-продуктов:

1. Недетерминированность - пользователи пишут что угодно вместо нажатия строго определенных заранее кнопок, система отвечает по-разному на одинаковые запросы. Классический QA тут не работает.
2. Компромисс между агентностью и контролем - чем больше автономии даешь ИИ, тем меньше контроля остается у людей.

Что такое CC/CD:

Continuous Development:
- Разбиваем большую цель на версии с растущей автономией (v1: AI-раб → v3: AI-коллега)
- Настраиваем простейшее приложение с логированием всего подряд и возможностью передачи контроля человеку
- Проектируем evals для измерения качества

Continuous Calibration:
- Запускаем на небольшой группе пользователей
- Анализируем реальные данные и паттерны фейлов
- Итеративно фиксим на основе данных

Пример из жизни - автоматизация саппорта:
- v1: Только роутинг тикетов по отделам
- v2: Предложение решений на основе инструкций и/или базы знаний
- v3: Автономное решение с эскалацией сложных кейсов до человека

Главный принцип - не давать ИИ полную автономию сразу. Система должна заслужить доверие через постепенное увеличение ответственности и доказательство надежности на каждом этапе. Это как онбординг нового сотрудника. Сначала простые задачи, потом постепенное расширение полномочий по мере накопления доверия.

По факту, это формализация того, что мы и так делаем в команде с нашими ассистентами и другими ИИ продуктами. Начинаем с простых сценариев, постепенно расширяем полномочия, мониторим каждый чих через evals, много бенчмаркинга.

Lennysnewsletter

Why your AI product needs a different development lifecycle

Introducing the Continuous Calibration/Continuous Development (CC/CD) framework

👍36🔥6❤3

9.23K views10:35

Записки C3PO

Прочитал клевое и резонирующее эссе Мустафы Сулеймана (CEO Microsoft AI) про Seemingly Conscious AI. Главная мысль: мы должны строить AI для людей, а не цифровых людей.

Через 2-3 года технически можно будет собрать AI с долговременной памятью, "личными" целями и способностью рассказывать о своих "переживаниях". Всё это уже доступно через API больших моделей. И люди поверят, что такая система сознательна.

Проблема уже проявляется. Harvard Business Review опросил 6000 юзеров AI - топовый юз кейс это companionship и терапия. Люди ищут в AI не инструмент, а собеседника. Некоторые влюбляются, другие считают своего бота богом.

Сулейман видит два пути развития AI:

Первый - AI как усилитель человека. Система, которая делает нас продуктивнее, креативнее, помогает достигать наших целей. Честный инструмент без претензий на личность.

Второй - AI как имитация личности. Система, которая косплеит эмоции, утверждает что страдает, требует прав и внимания. Создает иллюзию отношений вместо реальной пользы.

Парадокс в том, что технически второй путь проще. Добавить память и немного "личности" в промпт может любой. А вот построить действительно полезный AI, который при этом не создает иллюзию сознания - это вызов.

Позиция Сулеймана четкая: надо сознательно выбирать первый путь. Специально ломать иллюзию персоны. Напоминать, что это инструмент для усиления человека, а не замена человеческим отношениям.

Но индустрия к этому не готова. Мы даже не заметили, когда машины прошли тест Тьюринга. И похоже, скоро не заметим, как они начнут убеждать людей в своей сознательности.

Вопрос не в том, можем ли мы построить "сознательный" AI. Вопрос в том, должны ли.

mustafa-suleyman.ai

We must build AI for people; not to be a person

1🔥41👍13❤10

4.74K views12:43

Записки C3PO

Ты понимаешь тупик, но need to manage this mess

Обожаю Claude, но как же доставляет каждый раз его “смотря какой fabric”

😁43

3.82K views08:35

Записки C3PO

Благодаря посту Игоря понял, что прошел всего год 🤔

https://www.tgoop.com/seeallochnaya/2797

Please open Telegram to view this post

VIEW IN TELEGRAM

Сиолошная

Обсуждал со знакомым релиз GPT-5, и он в попытках переубедить меня написал следующее: «Такое упражнение: отмотай на год назад и посмотри на свои ожидания от gpt-5».

И... я ещё раз убедился, что действительно за всего лишь год индустрия прошла большой путь:…

👍16❤5😁3👏1

3.46K views08:03

2025/10/12 14:50:44
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>