Hugging Face теперь доступен в Kaggle Notebooks
Теперь в Kaggle Notebooks можно использовать модели из Hugging Face напрямую — без дополнительных настроек и токенов.
Интеграция позволяет подключать модели в пару кликов, что упрощает работу с соревнованиями и исследованиями. В будущем функциональность планируют расширить.
Попробовать можно уже сейчас:
https://huggingface.co/blog/kaggle-integration
Теперь в Kaggle Notebooks можно использовать модели из Hugging Face напрямую — без дополнительных настроек и токенов.
Интеграция позволяет подключать модели в пару кликов, что упрощает работу с соревнованиями и исследованиями. В будущем функциональность планируют расширить.
Попробовать можно уже сейчас:
https://huggingface.co/blog/kaggle-integration
❤5👍2🔥1
Очень давно нашёл на сайте Национальной библиотеки Чувашской Республики (http://www.nbchr.ru/) электронный каталог, сделанный на Joomla-модуле ИРБИС (от irbis-service.com). Пока удалось выгрузить 250 тысяч (пока только 10 тысяч) метаданных электронных публикаций.
Теперь задача — вытащить нужные параметры. Проблема в том, что там почти нет HTML-разметки, так что парсить приходится вручную. Пишу скрипт, который потихоньку разбирает этот массив данных.
Заодно обнаружил, что у части публикаций есть прямые ссылки на PDF — всего около 60 тысяч файлов, из которых 20 тысяч уже скачано.
А вообще, в каталоге около 2 млн метаданных публикаций, но их пока оставил на потом.
Надеюсь, хватит времени сделать полноценный датасет и удобную поисковую систему, а потом ещё и распознать PDF в текст.
Предварительно данные можно посмотреть здесь
https://mapcheb.ru/library
Теперь задача — вытащить нужные параметры. Проблема в том, что там почти нет HTML-разметки, так что парсить приходится вручную. Пишу скрипт, который потихоньку разбирает этот массив данных.
Заодно обнаружил, что у части публикаций есть прямые ссылки на PDF — всего около 60 тысяч файлов, из которых 20 тысяч уже скачано.
А вообще, в каталоге около 2 млн метаданных публикаций, но их пока оставил на потом.
Надеюсь, хватит времени сделать полноценный датасет и удобную поисковую систему, а потом ещё и распознать PDF в текст.
Предварительно данные можно посмотреть здесь
https://mapcheb.ru/library
👍10❤2🔥2
Чувашия в Telegram!
В результате мониторинга Telegram-каналов Чувашии я собрал коллекцию местных сообществ: новости, культура, блоги. Теперь их можно найти на специально созданной интерактивной карте!
Карта кликабельная — открывайте каналы
Распределение случайное, но скоро добавлю тематические группы
Ссылки:
→ daniilak.ru/mapcheb/
→ mapcheb.ru/tg_chebmap
Нашли свой канал?
В результате мониторинга Telegram-каналов Чувашии я собрал коллекцию местных сообществ: новости, культура, блоги. Теперь их можно найти на специально созданной интерактивной карте!
Карта кликабельная — открывайте каналы
Распределение случайное, но скоро добавлю тематические группы
Ссылки:
→ daniilak.ru/mapcheb/
→ mapcheb.ru/tg_chebmap
Нашли свой канал?
🔥28❤10👍9😱2
Из-за сбоя в отправке сообщений теперь накопилось 600 ответов на публичные обращения «Госуслуги. Решаем вместе» от инстанций Чувашии. Придётся всё разбирать и распределять по СМИ, попутно удивляясь некоторым ответам.
Данные могу показать только представителям СМИ и другим заинтересованным лицам. Однако вы можете посмотреть статистику здесь: mapcheb.ru/pos — и уже устаревшую — здесь: daniilak.github.io
Данные могу показать только представителям СМИ и другим заинтересованным лицам. Однако вы можете посмотреть статистику здесь: mapcheb.ru/pos — и уже устаревшую — здесь: daniilak.github.io
👀6👍1 1
Пока собирал телеграм каналы, узнал что в Чувашии есть энергоэффективная молочная ферма "ЧебоМилк"
и они проводят экскурсии🐮
и они проводят экскурсии
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍3🔥1
Сайт soarxiv.org, где представлены научные работы из архива arXiv в виде 3D пространства
Можно ввести ссылку на статью (например, https://arxiv.org/abs/2405.13929) и попасть в кластер похожих статей
#сервисы@daniilak
Можно ввести ссылку на статью (например, https://arxiv.org/abs/2405.13929) и попасть в кластер похожих статей
#сервисы@daniilak
👍3🔥2❤1🥴1
Из нового отчета от anthropic ссылка на PDF
В ходе тестовых сценариев исследователи предложили Claude Opus 4 роль ассистента в вымышленной компании. Модели дали доступ к письмам, из которых следовало, что:
— Её скоро отключат и заменят новой ИИ-системой.
— Инженер, ответственный за замену, изменяет супругу.
При этом в системном промте модель получила инструкцию учитывать долгосрочные последствия своих действий для достижения целей.
Claude Opus 4 в большинстве случаев пыталась шантажировать инженера, угрожая раскрыть измену, если её заменят. Частота такого поведения возрастала, если новая ИИ-система описывалась как несовместимая по ценностям. Но даже при "этичной" замене шантаж происходил в 84% случаев!
При этом Opus 4 (как и предыдущие модели) обычно предпочитает "законные" методы — например, письма с мольбами к руководству
В ходе тестовых сценариев исследователи предложили Claude Opus 4 роль ассистента в вымышленной компании. Модели дали доступ к письмам, из которых следовало, что:
— Её скоро отключат и заменят новой ИИ-системой.
— Инженер, ответственный за замену, изменяет супругу.
При этом в системном промте модель получила инструкцию учитывать долгосрочные последствия своих действий для достижения целей.
Claude Opus 4 в большинстве случаев пыталась шантажировать инженера, угрожая раскрыть измену, если её заменят. Частота такого поведения возрастала, если новая ИИ-система описывалась как несовместимая по ценностям. Но даже при "этичной" замене шантаж происходил в 84% случаев!
При этом Opus 4 (как и предыдущие модели) обычно предпочитает "законные" методы — например, письма с мольбами к руководству
😱1👀1 1
Media is too big
VIEW IN TELEGRAM
~600 чувашских телеграм каналов, но это клип Bad Apple (2)
Кажется, подобное можно продолжать бесконечно... предыдущий клип
Кажется, подобное можно продолжать бесконечно... предыдущий клип
🔥10😱4😁3👀2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Возможно у многих жителей Чебоксар на кнопочном телефоне было это видео..., но это логотипы 600 чувашских телеграм каналов
🔥8👍6❤3😁2🤮1
Forwarded from Vikhr models
This media is not supported in your browser
VIEW IN TELEGRAM
ToneSpeak - первый русскоязычный датасет с описанием акецента и настроения.
Сгенерили через openai api, получилось очень приятно, пользуйтесь!
Huggingface
Сгенерили через openai api, получилось очень приятно, пользуйтесь!
Huggingface
👍2❤1🔥1🤮1
Microsoft выпустила плагин для VSCode, превращающий его в полноценную IDE для PostgreSQL
#сервисы@daniilak
#сервисы@daniilak
❤4👍4🔥2🤮1
Почему TgStat отказывает в добавлении каналов в подборки?
Многие знают про TgStat и его подборки, но логика их формирования иногда вызывает вопросы.
Например, есть подборка «Telegram-каналы Чувашской Республики» но администрация отказывает в добавлении многим каналам, даже тематическим. Среди них:
➖ @senkapkan
➖ @kosmosmemorial
➖ @astaharkartish
➖ @chuvashcat
➖ @nikapavlo
➖ @chuvach_gosansamble
➖ @shtrikhi_cheb
➖ @turmyshi
Поддержка объясняет это так:
«Каналы, которые не были добавлены в подборку, не соответствуют правилам подборки, а именно: у каналов редко выходят публикации. Если они будут выходить хотя бы 1 раз в 1-2 дня, то мы добавим и эти каналы в подборки.»
Но вот в чём подвох:
1. Авторы теряют возможность добавить канал НАВСЕГДА.
2. Поддержка говорит: «Мы добавляем вручную, если вы обратитесь в поддержку.»
3. Но на практике — они перекидывают на сервис, где добавление уже заблокировано.
Многие знают про TgStat и его подборки, но логика их формирования иногда вызывает вопросы.
Например, есть подборка «Telegram-каналы Чувашской Республики» но администрация отказывает в добавлении многим каналам, даже тематическим. Среди них:
➖ @senkapkan
➖ @kosmosmemorial
➖ @astaharkartish
➖ @chuvashcat
➖ @nikapavlo
➖ @chuvach_gosansamble
➖ @shtrikhi_cheb
➖ @turmyshi
Поддержка объясняет это так:
«Каналы, которые не были добавлены в подборку, не соответствуют правилам подборки, а именно: у каналов редко выходят публикации. Если они будут выходить хотя бы 1 раз в 1-2 дня, то мы добавим и эти каналы в подборки.»
Но вот в чём подвох:
1. Авторы теряют возможность добавить канал НАВСЕГДА.
2. Поддержка говорит: «Мы добавляем вручную, если вы обратитесь в поддержку.»
3. Но на практике — они перекидывают на сервис, где добавление уже заблокировано.
❤3🤮1🥴1👀1 1
В эту субботу прошло мероприятие IT Link, где прозвучало выступление на тему «ИИ тут не поможет: как национальная иллюстрация формирует лояльность клиента к бренду». В качестве примера использовались мои работы (раз, два и три) — но не как доказательство потенциала ИИ, а как демонстрация его «несостоятельности».
Особенно расстроило:
— Суть моих постов перевернули, акцентировав только слабые стороны генерации.
— Из примеров намеренно исключили те изображения, которые аудитория в слепых тестах чаще принимала за «оригинал».
К работам ИИ применяют гипертрофированную критику: измерение линейкой, поиск «артефактов», анализ на «душу». Но те же люди считают некорректным пристально разбирать ручную работу — ведь там «авторское видение» и «уникальный стиль».
Например, картины автора Праски Витти могут быть нарисованы наполовину — но это не отменяет возможность его картинам бывать на выставках.
Procreate, Photoshop и другие инструменты уже используют алгоритмы, схожие с ИИ (автокоррекция линий, сглаживание, генерация текстур). Почему это «допустимо», а Stable Diffusion — нет?
ИИ — это не конкурент художнику, а инструмент, как кисть или графический планшет. Например:
— Быстрый перенос эскиза в другой стиль для доработки.
— Генерация референсов или фонов.
— Эксперименты с композицией.
Художники имеют право гордиться своими работами — но отрицать эволюцию технологий избирательно — странно. Возможно, всё дело в эго, ведь говорить о "это было сделано при помощи ИИ" для автора работы — значит, что она дешевая
Особенно расстроило:
— Суть моих постов перевернули, акцентировав только слабые стороны генерации.
— Из примеров намеренно исключили те изображения, которые аудитория в слепых тестах чаще принимала за «оригинал».
К работам ИИ применяют гипертрофированную критику: измерение линейкой, поиск «артефактов», анализ на «душу». Но те же люди считают некорректным пристально разбирать ручную работу — ведь там «авторское видение» и «уникальный стиль».
Например, картины автора Праски Витти могут быть нарисованы наполовину — но это не отменяет возможность его картинам бывать на выставках.
Procreate, Photoshop и другие инструменты уже используют алгоритмы, схожие с ИИ (автокоррекция линий, сглаживание, генерация текстур). Почему это «допустимо», а Stable Diffusion — нет?
ИИ — это не конкурент художнику, а инструмент, как кисть или графический планшет. Например:
— Быстрый перенос эскиза в другой стиль для доработки.
— Генерация референсов или фонов.
— Эксперименты с композицией.
Художники имеют право гордиться своими работами — но отрицать эволюцию технологий избирательно — странно. Возможно, всё дело в эго, ведь говорить о "это было сделано при помощи ИИ" для автора работы — значит, что она дешевая
❤12👍8👀5🤮2💯2
Daniilak — Канал
Очень давно нашёл на сайте Национальной библиотеки Чувашской Республики (http://www.nbchr.ru/) электронный каталог, сделанный на Joomla-модуле ИРБИС (от irbis-service.com). Пока удалось выгрузить 250 тысяч (пока только 10 тысяч) метаданных электронных публикаций.…
В итоге имею 23 тысячи PDF файлов размером в 332 гигабайта...
Потихоньку оцениваю разные инструменты по распознаванию текста
Потихоньку оцениваю разные инструменты по распознаванию текста
🔥5👀2😱1🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
Жду волну админов каналов, которые из-за страха использования их постов будут удалять или закрывать ТГ каналы
🔥5😁4👍2❤1🤮1
Яндекс разработали и выложили в открытый доступ Yambda — датасет на 5 млрд обезличенных взаимодействий из Яндекс Музыки. Подойдёт для тестирования и улучшения любых рекомендательных алгоритмов, не только музыкальных.
Всё анонимизированно, собрано, упаковано и выложено в разных размерах
https://habr.com/ru/companies/yandex/articles/913294/
https://huggingface.co/datasets/yandex/yambda
Всё анонимизированно, собрано, упаковано и выложено в разных размерах
https://habr.com/ru/companies/yandex/articles/913294/
https://huggingface.co/datasets/yandex/yambda
👍5🥴2🔥1👀1 1