В канун Нового 2018 года я опубликовал статью, в которой показал, как парсить страницы сайта и записывать результаты в Google BigQuery. Я считал это интересным способом создания собственного веб-скрейпера, поскольку он использовал мощность и масштабируемость платформы Google Cloud в сочетании с гибкостью бесшовного краулера, построенного на основе Puppeteer.
В сегодняшней статье я возвращаюсь к этому решению, чтобы поделиться с вами его последней версией, которая включает в себя функцию, которая может оказаться очень полезной при аудите файлов cookie, которые сохраняются на вашем сайте.
simoahava.com
Cookie Audit With Google BigQuery
Create attached notes ...
