Количество страниц: 300-350 страниц; это включает в себя код, скриншоты, таблицы и текст.
Целевая аудитория:
Эта книга идеально подходит для программистов JavaScript, веб-администраторов, специалистов по безопасности или тех, кто хочет выполнять web scraping.
Обязательные требования:
Эта книга будет являться руководством по использованию новейших возможностей JavaScript и Node.js для скрейпа (scrape) данных с веб-сайтов.
- извлекать данные из статических веб-страниц.
- использовать кэширование с базами данных и файлами, чтобы сэкономить время и управлять нагрузкой на серверы.
- практическую практику создания более сложных кроулеров (crawler) с использованием браузеров и параллельного скрейпа.
- создавать практические проекты для скрейпа данных с популярных сайтов, таких как например Twitter.
- как скрейпить данные с зависящего от JavaScript нагруженного веб-сайта, используя библиотеки очистки JavaScript и Puppeteer.
- как отправлять формы на сложных веб-сайтах
- как работать с пакетами JavaScript, такими как Cheerio, PhantomJS.
- как создавать скрейперы на основе классов с помощью библиотек Scrapy и реализовывать свое обучение на реальных веб-сайтах.
Возможны и другие темы для обучения с помощью этой книги.