Современный скрапинг веб-сайтов с помощью Python; Издательский дом "Питер", 2021

Купить Купить в кредит

Описание

Если программирование напоминает волшебство, то веб-скрапинг - это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.

В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.

- Разбирайте сложные HTML-страницы.

- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.

- Изучайте методы хранения данных, полученных с помощью скрапинга.

- Считывайте и извлекайте данные из документов.

- Очищайте и нормализуйте плохо отформатированные данные.

- Читайте и пишите информацию на естественных языках.

- Освойте поиск по формам и логинам.

- Изучите скрапинг JavaScript и работу с API.

- Используйте и пишите программы для преобразования изображений в текст.

- Учитесь обходить скрапинговые ловушки и блокаторы ботов.

- Протестируйте собственный сайт с помощью скрапинга.

2-е международное издание.

Видео Обзоры (5)

Умение парсить на Python — изменит твою жизнь

Парсинг сайтов Python: профессия и основы. Интенсив по программированию на Python

Парсинг сайтов на Python. Интенсив по Python

Лучшие Проекты Для Начинающих Python-Разработчиков

5 Лучших Сайтов Для Python Разработчика


Характеристики (17)


ПараметрЗначение
Автор(ы)
ИздательИздательский дом "Питер"
Год издания2021
ПереплетМягкий переплёт
Возрастные ограничения16
Кол-во страниц336
СерияБестселлеры O`Reilly
РазделПрограммирование
ISBN978-5-4461-1693-5
Возрастное ограничение16+
Количество страниц336
Формат165x231мм
Вес0.45кг
Тип обложкимягкая
Количество книг1
ИздательствоООО "Прогресс книга"
Бумагаофсет


Сравнить цены (6)

Цена от 245 грн. до 1254 грн. в 6 магазинах

МагазинЦенаНаличие
Bookovka UA
5/5
«Буковка» – це в першу чергу високий асортимент якісних книг відомих видань

Купить в кредит (2)


Компания Предложение
Prostocredit

Сума: від 500 до 6500 грн. Срок: 90 днів з наявністю пільгового періоду від 3 до 30 днів під знижену % ставку (з можливістю пролонгації пільгового кредиту необмеженої кількості раз) Процентна ставка: Пільгова 1,7%, Базова 2% Робота 24/7: заявки на кредит, видача кредиту

Aviracredit

Aviracredit - Онлайн кредит на картку до 6300 грн. Швидке рішення щодо заявки, гарний рівень узгодження заявок. Розмір виплати за перший виданий кредит - 227 грн.

Полезные онлайн-сервисы


Компания Предложение

Отзывы (4)


  • 5/5

    Пишу, как человек, который занимался парсингом больше 10 лет, но на других языках. Решил взять, чтобы сразу привыкнуть к инструментам на питоне, ну и вдруг чего новое бы узнал.
    Честно говоря, книга несколько неоднозначна. В целом, основные моменты парсинга упомянуты, как введение в тему - нормально. Но многое упомянуто вскользь. Регулярные выражения вообще привели краткий список символов, но многие регулярно используемые нюансы, вроде изменения поведения внутри [] упомянуты вообще только в примерах, т.е. если вы не в курсе, придется догадываться.
    Меньше всего понравился код. Да, даже в коротких книжных примерах есть скобки после if (что в питоне не принято), при чем где-то есть, где-то нет, как будто писали, как хотели. Есть изменение входящих в функции параметров. Есть противоречие описанным идеям и их реализации. В общем, если вы прям совсем не шарите в питоне и будете ориентироваться на приведенные примеры, они скорее будут вредны.
    Поэтому могу рекомендовать тем у кого же есть полгода-год конкретного опыта и нет опыта в парсинге - это будет идеальная аудитория для книги. Для остальных - в принципе, норм, но есть свои но.

    0
    0
  • 5/5

    Книга дельная, но есть немного устаревшая информация. Однако это не критично, все нюансы легко гуглятся в рунете. Знание линукса не нужны, по крайней мере в первой части книги точно. До второй пока не дошел)

    0
    0
  • 5/5

    Интересная книга!
    Открывает окно в мир технологий используемых в скрапинге.
    Для полноценного применения представленных решений необходимо конечно же знание в следующих областях: как минимум вы должны быть знакомы с ОС Linux, MySQL и Python.
    Изложение материала последовательное и поэтому не вызывает никаких трудностей в восприятии изложенного материала.
    В целом доволен результатом, полученным после прочтения. Рекомендую.

    0
    0
  • 3/5

    В целом книга полезна, но даёт довольно скромную информацию. И в самой книге написано, и в целом преподносится, что нас научат парсить динамические сайты и вызывать скрипты JS. Эт ложь, немного расскажут про Ajax сайты, что есть запросы, которые можно изучить и тогда...При этом я ожидал хотя бы описания парсинга сложных сайтов через консоль, что отслеживать, вот примеры - нет такого. Простые случаи вам прям дотошно расскажут, но не такие сложные детали. Спойлер - в книге просто посоветуют селениум. Сомнительно, но тоже можно использовать. Расскажут, как парсить ворд, csv, немного про многоточность и многопроцессность...Нет, в целом, это очень интересно и полезно для общего развития, но мы тут вроде как должны сайты парсить?! А википедии парсить можно и из википедии научиться. Если вы новичок и только хотите научиться парсингу, то подойдёт и будет интересно. Если ваша цель именно улучшить навыки парсинга и найти новые фичи - проходите мимо. Прям если коротко, то по стеку технологии книги советы : знать как работать с БД, selenium webdriver, немного затронут многопоточку...и всё в целом)

    0
    0
Зарегистрируйтесь и получайте бонусы за покупки!



закладки (0) сравнение (0)