Очередной ИИ-сервис для ведения соцсетей
Сервис рерайтит тексты из источников и получает тексты в любом объёме и формате и публикует в ВК или Телеграме
@GiveMePublicBot
Описание тут
Сервис рерайтит тексты из источников и получает тексты в любом объёме и формате и публикует в ВК или Телеграме
@GiveMePublicBot
Описание тут
Google Docs
Как настроить GMP
GiveMePublic — ИИ-инструмент для ведения соцсетей GiveMePublic — готовит посты к публикации. Освобождает время для более важных дел
🔥4
В Чебоксарах Сбер установил шесть милых мини-фигурок с QR-кодами, которые ведут на сайт с описаниями
— Девушка на Луне
— Волга
— Богатырь Улып
— Нарспи и Сентер
— Красавица Плаги
—Лиса-плясунья
Ссылки на них были получены через файл sitemap.xml сайта) А сами страницы забэкапил на WebArchive
UPD. Грустно, что никакой публичной информации о том, кто авторы. Узнавать о причастных приходится мониторя ТГ каналы.
— Девушка на Луне
— Волга
— Богатырь Улып
— Нарспи и Сентер
— Красавица Плаги
—Лиса-плясунья
Ссылки на них были получены через файл sitemap.xml сайта) А сами страницы забэкапил на WebArchive
UPD. Грустно, что никакой публичной информации о том, кто авторы. Узнавать о причастных приходится мониторя ТГ каналы.
👍7❤1🔥1
Прекрасный проект https://trackthis.link/ предназначен для обмана рекламодателей путем открытия множества вкладок в браузере. Однако стоит отметить, что за последние пять лет не было обновлений, и некоторые из открываемых ссылок уже недоступны, но не все
This media is not supported in your browser
VIEW IN TELEGRAM
🦙 LlamaCoder — веб-приложение с открытым исходным кодом, которое может генерировать целое приложение из описания.
Репозиторий уже был клонирован сотнями разработчиков на GitHub и отмечен более 2 тысяч раз.
https://llamacoder.together.ai
Репозиторий уже был клонирован сотнями разработчиков на GitHub и отмечен более 2 тысяч раз.
https://llamacoder.together.ai
❤4👍1🔥1 1
DuckDB обеспечивает высокую скорость работы с табличными и, в основном, иерархическими данными. Однако он не поддерживает чтение файлов форматов Excel, ORC и других, в то время как такие библиотеки, как Pandas и Polars, могут их обрабатывать и частично записывать.
Среди основных проблем DuckDB можно выделить недостаточное понимание кодировок, кроме UTF-8, для CSV-файлов, что требует предварительной обработки данных
CSV — наиболее распространённый формат, который плохо стандартизирован в своем "сыром" виде. Часто CSV-файлы являются результатами экспорта из Excel
Еще одним недостатком DuckDB при работе с CSV является отсутствие поддержки алгоритмов сжатия, кроме GZip. Это важный фактор, особенно с точки зрения эффективности и стоимости хранения данных. Например, в Dateno несколько сотен тысяч CSV-файлов занимают около 4 ТБ. Хранить их в оригинальном виде неэффективно; сжатие с помощью GZip — лучший вариант, а еще более эффективно использовать такие форматы, как zstd или Parquet с сжатием, поскольку эти данные статичны.
Таким образом, оптимальным решением для обработки данных оказывается комбинация DuckDB, Polars, Pandas, предобработки и постобработки данных, а также хранение исходных данных в формате Parquet
Взял тут https://www.tgoop.com/begtin/5893
Среди основных проблем DuckDB можно выделить недостаточное понимание кодировок, кроме UTF-8, для CSV-файлов, что требует предварительной обработки данных
CSV — наиболее распространённый формат, который плохо стандартизирован в своем "сыром" виде. Часто CSV-файлы являются результатами экспорта из Excel
Еще одним недостатком DuckDB при работе с CSV является отсутствие поддержки алгоритмов сжатия, кроме GZip. Это важный фактор, особенно с точки зрения эффективности и стоимости хранения данных. Например, в Dateno несколько сотен тысяч CSV-файлов занимают около 4 ТБ. Хранить их в оригинальном виде неэффективно; сжатие с помощью GZip — лучший вариант, а еще более эффективно использовать такие форматы, как zstd или Parquet с сжатием, поскольку эти данные статичны.
Таким образом, оптимальным решением для обработки данных оказывается комбинация DuckDB, Polars, Pandas, предобработки и постобработки данных, а также хранение исходных данных в формате Parquet
Взял тут https://www.tgoop.com/begtin/5893
Telegram
Ivan Begtin
Про разного рода технически сложные задачи и их решения.
Я тут регулярно пишу про разные форматы файлов данных и могу сказать что, конечно, файловых форматов как и стандартов какое-то бесконечное количество. Когда-то я и сам делал и периодически обновляю…
Я тут регулярно пишу про разные форматы файлов данных и могу сказать что, конечно, файловых форматов как и стандартов какое-то бесконечное количество. Когда-то я и сам делал и периодически обновляю…
❤3👍3
Для начинающих (и не только) будет полезно
https://dfedorov.spb.ru/pandas/
Гоняем 100гб csv-файлы на очердной мультиварке 2000-года туда-сюда
https://dfedorov.spb.ru/pandas/
Гоняем 100гб csv-файлы на очердной мультиварке 2000-года туда-сюда
dfedorov.spb.ru
Введение в Pandas, NumPy, Matplotlib, Plotly, Altair для анализа данных
Python, Pandas, NumPy, Matplotlib, Plotly, Altair, Seaborn для анализа данных
👀3👍2🔥2
Последнее время мысль заказать 2-метровый памятник Пикачу кажется заманчивой
❤2👍2😁2🔥1
Может публиковать сюда задачки?
Задача
Есть лог звонков call-центра. В нем зафиксировано время начала и конца звонка.
Количество записей в логе может быть очень большим, как и сам лог-файл. Считайте, что он минимум в 10 раз больше вашей оперативной памяти.
Нужно написать эффективный по использованию памяти скрипт который сможет определить минимальное количестов операторов call-центра, чтобы ни один звонок не ожидал оператора
Формат лога приблизительно такой
FROM:2021-02-04 00:46 TO:2021-02-04 00:53
FROM:2021-01-29 18:46 TO:2021-01-29 19:02
FROM:2021-02-02 17:02 TO:2021-02-02 17:09
FROM:2021-01-30 15:44 TO:2021-01-30 16:05
FROM:2021-02-05 11:58 TO:2021-02-05 12:14
Задача
Есть лог звонков call-центра. В нем зафиксировано время начала и конца звонка.
Количество записей в логе может быть очень большим, как и сам лог-файл. Считайте, что он минимум в 10 раз больше вашей оперативной памяти.
Нужно написать эффективный по использованию памяти скрипт который сможет определить минимальное количестов операторов call-центра, чтобы ни один звонок не ожидал оператора
Формат лога приблизительно такой
FROM:2021-01-30 22:18 TO:2021-01-30 22:31FROM:2021-02-04 00:46 TO:2021-02-04 00:53
FROM:2021-01-29 18:46 TO:2021-01-29 19:02
FROM:2021-02-02 17:02 TO:2021-02-02 17:09
FROM:2021-01-30 15:44 TO:2021-01-30 16:05
FROM:2021-02-05 11:58 TO:2021-02-05 12:14
❤1👍1🔥1
Поставил себе на мак бесплатное приложение alt-tab-macos.netlify.app
Теперь у меня есть нормальный cmd+tab, который показывает все окна приложений в выбранном рабочем столе, а не только сгруппированный список приложений (классический cmd+ tab показал бы 4 значка вместо 6)
В качестве лучшей альтернативы можно попробовать manytricks.com/witch
Теперь у меня есть нормальный cmd+tab, который показывает все окна приложений в выбранном рабочем столе, а не только сгруппированный список приложений (классический cmd+ tab показал бы 4 значка вместо 6)
В качестве лучшей альтернативы можно попробовать manytricks.com/witch
👍3🔥1😍1
Daniilak — Канал
Шарарам жестко нагревает MacBook Air M3
Продолжая погружаться в иной мир, заметил интересную деталь:
В Windows, если зажать кнопку (это работает со всеми клавишами), она нажимается бесконечно быстро.
В macOS нужно нажимать каждый раз. И что интересно, это работает частично:
— Если зажать пробел, стрелки, слеш или другие специальные клавиши, то они будут нажиматься (кстати, медленнее, чем в Windows).
— Если зажать клавишу с любой буквой или цифрой, то она сработает только один раз.
Я привык перемещаться стрелками, а в macOS, пока стрелка доберется до нужной позиции, можно успеть заварить и выпить чай.
В Windows, если зажать кнопку (это работает со всеми клавишами), она нажимается бесконечно быстро.
В macOS нужно нажимать каждый раз. И что интересно, это работает частично:
— Если зажать пробел, стрелки, слеш или другие специальные клавиши, то они будут нажиматься (кстати, медленнее, чем в Windows).
— Если зажать клавишу с любой буквой или цифрой, то она сработает только один раз.
Я привык перемещаться стрелками, а в macOS, пока стрелка доберется до нужной позиции, можно успеть заварить и выпить чай.
👎1👀1 1
Люди, связанные с АНБ, несколько лет вносили изменения в репозиторий SSH, чтобы создать бэкдор для себя. Весной этого года одному из пользователей не понравилось, что его PostgreSQL запускается на 5 мс медленнее, чем обычно, и он решил изучить код
https://habr.com/ru/news/804163/
https://habr.com/ru/news/804163/
Хабр
Бэкдор в xz нашли из-за замедления работы sshd в полсекунды
Уязвимость в xz Utils была построена по схеме supply chain attack, атака на цепочку поставок. Для её реализации злоумышленнику (или их группе) пришлось два года втираться в доверие к сообществу...
🔥1👀1 1
Please open Telegram to view this post
VIEW IN TELEGRAM
👀2
На Kaggle завезли новые ачивки 👍
Появились значки за активности под названием Badged (например, год на Kaggle, засабмитил в командное соревнование, создал Python ноутбук и прочее). Полный список тут.
Кроме этого появились так называемые Awards: это больше про фактические достижения типа мест в рейтингах, организации соревнований, публикации датасета и тд. Полный список тут.
Я там Datasets Expert, нужно потратить немного времени, чтобы сделать больше ачивок
Как минимум, можно попробовать погенерить датасеты, есть пару десятков тем
Появились значки за активности под названием Badged (например, год на Kaggle, засабмитил в командное соревнование, создал Python ноутбук и прочее). Полный список тут.
Кроме этого появились так называемые Awards: это больше про фактические достижения типа мест в рейтингах, организации соревнований, публикации датасета и тд. Полный список тут.
Я там Datasets Expert, нужно потратить немного времени, чтобы сделать больше ачивок
Как минимум, можно попробовать погенерить датасеты, есть пару десятков тем
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👀1