Notice: file_put_contents(): Write of 932 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 8192 of 9124 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
noindex, nofollow@notjohnmu P.1323
NOTJOHNMU Telegram 1323
Вдохновившись роликом Ивана Зимина (@heymoneymaker) про ChatGPT для написания скриптов, решил попробовать создать решение для выгрузки и разбора больших сайтмапов.

Это просто демонстрация, как человек практически без знания python'а и минимальным опытом программирования может автоматизировать работу без привлечения разработчиков :) Потратил полчаса времени, в процессе было несколько уточняющих промтов после того, как столкнулся с ошибками при парсинге. Использовал GPT-4.

Что он делает:
- выгружает sitemap index, проходит по всем сайтмапам внутри
- выводит кол-во урлов в каждом сайтмапе и общее кол-во урлов
- складывает все полученные урлы в массив и сохраняет в текстовый файл
- выводит таблицу: Первый фрагмент урла | Кол-во вхождений
- сохраняет в SQLite-базу таблицу с фрагментами и датой для последующего поиска изменений.

Развивать его, безусловно есть куда (использовать регулярки для выделения разделов, а не просто первый уровень урла, добавить визуализацию изменений по датам и т.п.)



tgoop.com/notjohnmu/1323
Create:
Last Update:

Вдохновившись роликом Ивана Зимина (@heymoneymaker) про ChatGPT для написания скриптов, решил попробовать создать решение для выгрузки и разбора больших сайтмапов.

Это просто демонстрация, как человек практически без знания python'а и минимальным опытом программирования может автоматизировать работу без привлечения разработчиков :) Потратил полчаса времени, в процессе было несколько уточняющих промтов после того, как столкнулся с ошибками при парсинге. Использовал GPT-4.

Что он делает:
- выгружает sitemap index, проходит по всем сайтмапам внутри
- выводит кол-во урлов в каждом сайтмапе и общее кол-во урлов
- складывает все полученные урлы в массив и сохраняет в текстовый файл
- выводит таблицу: Первый фрагмент урла | Кол-во вхождений
- сохраняет в SQLite-базу таблицу с фрагментами и датой для последующего поиска изменений.

Развивать его, безусловно есть куда (использовать регулярки для выделения разделов, а не просто первый уровень урла, добавить визуализацию изменений по датам и т.п.)

BY noindex, nofollow




Share with your friend now:
tgoop.com/notjohnmu/1323

View MORE
Open in Telegram


Telegram News

Date: |

Telegram channels fall into two types: Polls 5Telegram Channel avatar size/dimensions Just as the Bitcoin turmoil continues, crypto traders have taken to Telegram to voice their feelings. Crypto investors can reduce their anxiety about losses by joining the “Bear Market Screaming Therapy Group” on Telegram. Matt Hussey, editorial director of NEAR Protocol (and former editor-in-chief of Decrypt) responded to the news of the Telegram group with “#meIRL.”
from us


Telegram noindex, nofollow
FROM American