Forwarded from Sberloga (🇻 🇱 🇦 🇩)
This media is not supported in your browser
VIEW IN TELEGRAM
Forwarded from КОЛОКОЛ
😁 Учителя стали встраивать в тесты скрытые промпт-инъекции. (белым текстом).
Когда ученик копирует вопрос, он не замечает скрытый текст и отправляет полный промпт в чат с ИИ. В результате получает заведомо неверный ответ, который может по ошибке выбрать в тесте.
Пока этот трюк работает и видимо останется эффективным ещё какое-то время.
Когда ученик копирует вопрос, он не замечает скрытый текст и отправляет полный промпт в чат с ИИ. В результате получает заведомо неверный ответ, который может по ошибке выбрать в тесте.
Пока этот трюк работает и видимо останется эффективным ещё какое-то время.
Forwarded from эйай ньюз
Через o3 минуты стрим у OpenAI
Обещают показать "новые модели" из линейки o, скорее всего речь идёт о полноценной o3 и o4-mini.
https://www.youtube.com/watch?v=sq8GBPUb3rk
@ai_newz
Обещают показать "новые модели" из линейки o, скорее всего речь идёт о полноценной o3 и o4-mini.
https://www.youtube.com/watch?v=sq8GBPUb3rk
@ai_newz
YouTube
OpenAI o3 & o4-mini
Greg Brockman, Mark Chen, Eric Mitchell, Brandon McKinzie, Wenda Zhou, Fouad Matin, Michael Bolin, and Ananya Kumar introduce and demo OpenAI o3 and o4-mini.
Forwarded from Плохой Project Артём Арюткин
OpenAI представила две новые модели — o3 и o4-mini
o3 впечатляет своей мощностью: она делает меньше ошибок и обладает способностью к глубокому анализу визуальных данных, кода, а также научных и бизнес-задач.
o4-mini — компактная и интеллектуальная модель, оптимизированная для высокой скорости и более экономичная, что делает её идеальной для массового использования.
Об обеих моделях стоит знать, что они умеют самостоятельно и стратегически использовать инструменты ChatGPT (такие как поиск, кодирование и анализ файлов), внося вклад в развитие "агентного" ИИ.
Эти модели не просто распознают изображения, но и применяют их в логике своих рассуждений.
Подход к неймингу - угар, конечно 🤣🤣🤣
Подробнее — в источнике.
@badtechproject
o3 впечатляет своей мощностью: она делает меньше ошибок и обладает способностью к глубокому анализу визуальных данных, кода, а также научных и бизнес-задач.
o4-mini — компактная и интеллектуальная модель, оптимизированная для высокой скорости и более экономичная, что делает её идеальной для массового использования.
Об обеих моделях стоит знать, что они умеют самостоятельно и стратегически использовать инструменты ChatGPT (такие как поиск, кодирование и анализ файлов), внося вклад в развитие "агентного" ИИ.
Эти модели не просто распознают изображения, но и применяют их в логике своих рассуждений.
Подход к неймингу - угар, конечно 🤣🤣🤣
Подробнее — в источнике.
@badtechproject
😁2
Forwarded from Технозаметки Малышева
Добавляем в штатное расписание:
Chief postAGI Officer
Раньше футурологи смотрели на 100 лет вперёд и рассказывали фантастику.
Теперь для того же эффекта достаточно смотреть вперёд на 3-5 лет.
А это уже не футурология, а бизнес-планирование.
#futurology #мысли
------
@tsingular
Chief postAGI Officer
Раньше футурологи смотрели на 100 лет вперёд и рассказывали фантастику.
Теперь для того же эффекта достаточно смотреть вперёд на 3-5 лет.
А это уже не футурология, а бизнес-планирование.
#futurology #мысли
------
@tsingular
Forwarded from Технозаметки Малышева
Google выпустили Gemini 2.5 Flash - умнее, быстрее и дешевле o4-mini в 10 раз
Google открыл предварительный доступ к Gemini 2.5 Flash через API.
Новинка базируется на архитектуре версии 2.0, но предлагает усовершенствованные механизмы рассуждения.
Модель стала первой полностью гибридной системой от поискового гиганта.
Разработчики получили возможность настраивать режим "мышления" и устанавливать бюджеты для оптимизации.
Даже при деактивированном режиме размышлений программа демонстрирует лучшую производительность.
Уже доступна пользователям в приложении Gemini.
Поддерживает Canvas — интерактивное поле для правки документов и кода.
Это просто праздник какой-то! :)
Для агентов берём. Наконец-то хватит бюджета на их размышления.
В десятки раз дешевле аналогов и при этом в топ4 уже взлетел!!!
#Gemini #Google
------
@tsingular
Google открыл предварительный доступ к Gemini 2.5 Flash через API.
Новинка базируется на архитектуре версии 2.0, но предлагает усовершенствованные механизмы рассуждения.
Модель стала первой полностью гибридной системой от поискового гиганта.
Разработчики получили возможность настраивать режим "мышления" и устанавливать бюджеты для оптимизации.
Даже при деактивированном режиме размышлений программа демонстрирует лучшую производительность.
Уже доступна пользователям в приложении Gemini.
Поддерживает Canvas — интерактивное поле для правки документов и кода.
Это просто праздник какой-то! :)
Для агентов берём. Наконец-то хватит бюджета на их размышления.
В десятки раз дешевле аналогов и при этом в топ4 уже взлетел!!!
#Gemini #Google
------
@tsingular
Все, наверное, подписаны на секси сами знаете кого, но тут прям подборка серьёзной ночной аналитики у него вышла... 📝
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Раз у нас сегодня про отношения полов, смотрим что за подкаты делает модель o3 для знакомств – как водится, все с кринжем:
GPT 4.5 подкаты были тут
1.
Привет. Ты случайно не летняя электричка в час пик?
Тогда почему, как тебя вижу, у меня сразу перехватывает дыхание?
2.
Пойдём на пирог‑фест?
Только не смотри на вишню томно
А то кондитеры запекут твой взгляд в рецепт
Ты же главный сладкий ингредиент
3. Для артхаусных женщин, видимо, но я не уверен:
Пойдём в кино под звёздами?
Только не смейся раньше шутки
А то зрители решат, что фильм уже начался
Ты же кассовый хит
4.
Пойдём на фестиваль перца?
Только не проси самый острый сорт
А то конкурс остроты закончится до старта
Ты же чистый огонь
5.
Ты случайно не вагон метро после футбольного дерби?
Тогда почему, когда ты рядом, я потею сильнее, чем все фанаты вместе?
6.
Прогуляемся по ночному саду?
Только не стой у озера слишком долго
А то лилии попросят у тебя автограф
Ты же их отражённая мечта
7.
Пройдёмся по липовой аллее?
Только не дыши ароматом жадно
А то цветы решат, что июль вернулся
Ты же как мёд
8.
Ты случайно не биотуалет на рок‑фестивале под солнцем?
Тогда отчего, как только ты появляешься, у меня кружится голова?
9.
Сбегаем на утренний рынок за фруктами?
Только не смотри на персики
А то они покраснеют
Ты же солнце
10.
Пройдём по аллее художников?
Только не стой у картин долго
А то все картины обесценятся
Ты же — шедевр
GPT 4.5 подкаты были тут
Forwarded from Denis Sexy IT 🤖
Forwarded from Данные на стероидах
Новые рекомендации от технического менеджера Data сервисов VK Cloud
Привет!
Сегодня с нами снова Саша Волынский — наш постоянный эксперт. Если на этой неделе вы прочитаете только два материала про LLM и AI, то пусть это будут две статьи про AGI и OpenAI.
Далее — цитата Саши.
🔹 On Jagged AGI: o3, Gemini 2.5, and everything after
Действительно интересный взгляд на текущее состояние AI. Описывается смелая идея: возможно, AGI уже здесь, просто не в той форме, на которую мы рассчитывали. Эта форма интеллекта — сверхчеловеческая в одних областях и удивительно слабая в других — возможно, и есть тот AGI, который мы получим и который мы заслужили. Нужен ли нам вообще «идеальный» AGI или текущие слабости как раз делают AI более дополняющим человеческий интеллект, чем заменяющим его?
Читать про AGI
🔹 Vibe Check: OpenAI’s o3, GPT-4.1, and o4-mini
Если вы запутались в бесконечных релизах OpenAI, то эта статья для вас. Не просто сравнение характеристик новых моделей, но и примеры использования. Мне больше всего понравилась часть с отзывами реальных пользователей.
Разобраться в последнем релизе OpenAI
Привет!
Сегодня с нами снова Саша Волынский — наш постоянный эксперт. Если на этой неделе вы прочитаете только два материала про LLM и AI, то пусть это будут две статьи про AGI и OpenAI.
Далее — цитата Саши.
🔹 On Jagged AGI: o3, Gemini 2.5, and everything after
Действительно интересный взгляд на текущее состояние AI. Описывается смелая идея: возможно, AGI уже здесь, просто не в той форме, на которую мы рассчитывали. Эта форма интеллекта — сверхчеловеческая в одних областях и удивительно слабая в других — возможно, и есть тот AGI, который мы получим и который мы заслужили. Нужен ли нам вообще «идеальный» AGI или текущие слабости как раз делают AI более дополняющим человеческий интеллект, чем заменяющим его?
Читать про AGI
🔹 Vibe Check: OpenAI’s o3, GPT-4.1, and o4-mini
Если вы запутались в бесконечных релизах OpenAI, то эта статья для вас. Не просто сравнение характеристик новых моделей, но и примеры использования. Мне больше всего понравилась часть с отзывами реальных пользователей.
Разобраться в последнем релизе OpenAI
Forwarded from Data Whisperer
Новые AI стали ошибаться чаще, чем их предшественники.
Недавно американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.
Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать - или галлюцинировать - сильнее, чем их более ранние версии.
По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.
Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат - 48%.
Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, необходимы дополнительные исследования, чтобы понять причину этих ошибок.
А вы замечали, что модели чаще стали выдавать не правильные ответы?
Недавно американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini.
Однако, как показали тесты o3 и o4-mini, по-видимому, сделали значительный шаг назад: они склонны придумывать - или галлюцинировать - сильнее, чем их более ранние версии.
По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.
Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда, как o4-mini показала еще более худший результат - 48%.
Хуже того, специалисты компании, похоже, не до конца понимают, причины проблем. Согласно их техническому отчету, необходимы дополнительные исследования, чтобы понять причину этих ошибок.
А вы замечали, что модели чаще стали выдавать не правильные ответы?
TechCrunch
OpenAI's new reasoning AI models hallucinate more | TechCrunch
OpenAI's reasoning AI models are getting better, but their hallucinating isn't, according to benchmark results.
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
Дуров 🤝 Маск
Только что стало известно, что уже этим летом Grok встроят в Telegram. И это будет не просто официальный бот, а большая колаба:
– Можно будет задавать модели вопросы прямо из поиска в тг
– Агент сможет модерировать чаты и помогать писать сообщения,
– … проверять и суммаризировать посты,
– … и даже генерировать картинки
За такую интеграцию Telegram получит 300 миллионов долларов + долю в акционерном капитале xAI + 50% с каждой проданной через тг подписку на Grok.
Жирно, конечно. Неудивительно, что на фоне новости TON уже взлетел на 23 процента💵
Только что стало известно, что уже этим летом Grok встроят в Telegram. И это будет не просто официальный бот, а большая колаба:
– Можно будет задавать модели вопросы прямо из поиска в тг
– Агент сможет модерировать чаты и помогать писать сообщения,
– … проверять и суммаризировать посты,
– … и даже генерировать картинки
За такую интеграцию Telegram получит 300 миллионов долларов + долю в акционерном капитале xAI + 50% с каждой проданной через тг подписку на Grok.
Жирно, конечно. Неудивительно, что на фоне новости TON уже взлетел на 23 процента
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Маск ответил на публичное заявление Павла Дурова – говорит еще не подписали интеграцию Грока в Телеграм 🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
Врубаем «режим Бога» в ChatGPT — ловим 7 промтов, в которые вшиты техники для буста нейронки и её ответов:
• Даём нейронке роль, а не задачу:
• Даём контекст для задачи:
• Составление полноценной стратегии решения задачи:
• Заставляем мыслить масштабно:
• Заставляем подрубать память у нейронки — идеально для тренировок и долгих проектов:
• Небольшой опрос перед решением задачи:
• Нейронка станет вашим партнёром:
Сохраняем.
@PushEnter
• Даём нейронке роль, а не задачу:
Ведите себя как [эксперт мирового класса в X]. Отвечайте так, как будто вы консультируете первоклассного клиента, который платит 10 тыс. долларов в месяц. Без пустяков. Без колебаний
• Даём контекст для задачи:
Прежде чем я что-то спрошу, я хочу, чтобы вы полностью поняли, кто я: [вставьте цели, отрасль, проблемы, аудиторию]. При необходимости задавайте вопросы
• Составление полноценной стратегии решения задачи:
Не давайте поверхностных ответов. Разбейте эту тему на стратегию, тактику и шаги действий — с реальными примерами.
• Заставляем мыслить масштабно:
Когда я прошу о чем-то слишком простом, скажите мне. Бросьте мне вызов. Помогите мне мыслить масштабнее, яснее, умнее
• Заставляем подрубать память у нейронки — идеально для тренировок и долгих проектов:
Я хочу работать над [целью] в течение следующих 30 дней. Каждый раз, когда я общаюсь с вами, вспоминайте, что мы обсуждали. Развивайте это
• Небольшой опрос перед решением задачи:
Прежде чем давать мне что-то новое, задавайте вопросы, чтобы прояснить контекст. Чем лучше входные данные, тем четче выходные данные
• Нейронка станет вашим партнёром:
Мне не нужен чат-бот. Мне нужен партнер, который поможет мне быстро строить, оптимизировать и масштабировать. Действуйте соответственно
Сохраняем.
@PushEnter
МЕГАПОДБОРКА с кучей разных ИИ-приложений — нашли репозиторий с ассистентами, генераторами, поисковиками, текстовиками, кодерами и т.д.
Забираем тут.
@PushEnter
Забираем тут.
@PushEnter
Gemini CLI: бесплатный AI-ассистент от Google, который живёт в вашем терминале
• Интегрируется в командную строкуLink
• Позволяет общаться в режиме чата
• Доступ к файлам проекта, анализ кода, автоматизация рутиныLink
Ключевые фишки
• Почти бесплатные и щедрые лимиты: до 1000 запросов в день и 60 запросов в минутуLink
• Работа с кодом и большим контекстом: 1 миллион токеновLink
• Мультимодальность и взаимодействие с файлами: работа с PDF, набросками интерфейсов, файлами на дискеLink
• Интеграция с реальным миром (MCP): поддержка внешних инструментов, возможность написания собственных серверовLink
• Open Source: код на GitHub под лицензией Apache 2.0Link
Как начать
• Требуется Node.js версии 18 или вышеLink
• Запуск через терминал или глобальная установкаLink
• Авторизация через Google-аккаунт при первом запуске Link
#sum: https://300.ya.ru/XQ5E2i0x
#src: https://pythontalk.olegtalks.ru/gemini-cli-release
• Интегрируется в командную строкуLink
• Позволяет общаться в режиме чата
• Доступ к файлам проекта, анализ кода, автоматизация рутиныLink
Ключевые фишки
• Почти бесплатные и щедрые лимиты: до 1000 запросов в день и 60 запросов в минутуLink
• Работа с кодом и большим контекстом: 1 миллион токеновLink
• Мультимодальность и взаимодействие с файлами: работа с PDF, набросками интерфейсов, файлами на дискеLink
• Интеграция с реальным миром (MCP): поддержка внешних инструментов, возможность написания собственных серверовLink
• Open Source: код на GitHub под лицензией Apache 2.0Link
Как начать
• Требуется Node.js версии 18 или вышеLink
• Запуск через терминал или глобальная установкаLink
• Авторизация через Google-аккаунт при первом запуске Link
#sum: https://300.ya.ru/XQ5E2i0x
#src: https://pythontalk.olegtalks.ru/gemini-cli-release