Сбор данных в Интернете на языке R; ДМК Пресс, 2017

1290 грн.

  • Издатель: ДМК-Пресс
  • ISBN: 978-5-97060-459-5
  • EAN: 9785970604595

  • Книги: Программирование
  • ID: 1777798
Купить Купить в кредит

Описание

Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.

Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.

Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.

Видео Обзоры (5)

Язык R для интернет маркетинга: 1.1. История создания и назначение языка R

Анализ данных с применением языка и среды для статистической обработки данных R

СРОЧНО ОТКЛЮЧИ ЭТИ НАСТРОЙКИ НА СВОЕМ СМАРТФОНЕ! ХИТРОСТЬ РАЗРАБОТЧИКОВ ПРО СБОР ЛИЧНЫХ ДАННЫХ

Импорт (парсинг) нетабличных данных с сайтов в Excel с помощью Power Query

Доклад: Как работать с API Google Analytics на языке R с помощью пакета googleAnalyticsR (8P Online)


Характеристики (25)


ПараметрЗначение
Автор(ы)
Переплет200.00mm x 140.00mm x 16.00mm
ИздательДМК Пресс
Год издания2017
Возрастные ограничения12
Кол-во страниц282
Вес, в граммах290
ИздательствоДМК Пресс
Тип обложкимягкая
Количество страниц282
Назначениедля технических ВУЗов
Количество книг1
Оформление обложкилакировка
АвторХрамов Дмитрий Александрович
Формат20 x 14.1 x 1.3
РазделПрограммирование
ISBN978-5-97060-459-5
Вес0.29кг
Размеры21,50 см × 14,50 см × 1,40 см
Обложкамягкая обложка
Язык изданияrus
Страниц280
Переплётмягкий
ТематикаПрограммирование
Возрастное ограничение16+


Цены (1)

Цена от 1290 грн. до 1290 грн. в 1 магазинах

МагазинЦенаНаличие
Bookovka UA
5/5
«Буковка» – це в першу чергу високий асортимент якісних книг відомих видань

Купить в кредит (2)


Компания Предложение
Prostocredit

Сума: від 500 до 6500 грн. Срок: 90 днів з наявністю пільгового періоду від 3 до 30 днів під знижену % ставку (з можливістю пролонгації пільгового кредиту необмеженої кількості раз) Процентна ставка: Пільгова 1,7%, Базова 2% Робота 24/7: заявки на кредит, видача кредиту

Aviracredit

Aviracredit - Онлайн кредит на картку до 6300 грн. Швидке рішення щодо заявки, гарний рівень узгодження заявок. Розмір виплати за перший виданий кредит - 227 грн.

Полезные онлайн-сервисы


Компания Предложение

Отзывы (6)


  • 4/5

    Не вполне согласен с Raniod’ом. Некоторые книги интересно читать, не зная основ. Язык R не изучают на каждом углу. Отсюда, книга – на крепкую четверку. Прочитаю – поставлю выше. Все, что относится к BI, нужно брать при реальном количестве полезной информации более 10% (выше ошибки опыта).

    0
    0
  • 1/5

    Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!

    0
    0
  • 5/5

    Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
    Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
    Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.
    Только для опытных пользователей R, которым надо работать с сайтами.
    Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что

    0
    0
  • 4/5

    Данную книгу не стоит считать «полным» руководством по сбору данных в интернете. Она скорее как базовый справочник по технологиям сбора с помощью R, поскольку в книге даны простые примеры по каждому пакету, чуть более сложные или спецефичные ситуации всё равно придётся гуглить на иностранных ресурсах, некоторые аспекты выгрузки вообще пропущенны, напр управление куками и их сохранение. Книга лишь позволит быстро сориентировать какой пакет стоит использовать.
    Кстати из 280 стр только 180 относятся к сбору данных, первые 100 стр это рассказывание про синтаксис R, не очень понятно зачем они нужны, т.к человек интересующийся выгрузкой из сети с помощью R по определению уже знает синтаксис, раз задаётся такими прикладными вопросами. Эти 180 стр можно вдумчиво прочитать за 2 вечера.
    В общем поставлю 4 из 5 и то из-за того что на русском и даёт быстрое представление о способах выгрузки, без гугления на иностранных ресурсах. Но объективно, по содержанию, это скорее 3 за 180 стр, особенно если по цене бумажного варианта(900 р)

    0
    0
  • 4/5

    Книга в концентрированном виде информация об извлечении данных преимущественно из сети Internet по средствам языка R. В самом начале книги идет отсылка к BI (Business Intelligence) не как значению «бизнес-анализ» в широком смысле слова, а к значению «бизнес-разведка». Значение слова «разведка» (Intelligence) следует рассматривать не столько как слежение за конкурентами, сколько как отслеживание собственных внутренних бизнес-процессов организации. Автор справедливо замечает, что сбор данных это основа для «data mining» в общем смысле данного определения.
    Отличием книги является наличие в каждой главе списка литературы, откуда можно узнать более детальную информацию по темам главы.

    0
    0
  • 5/5

    Годная книга, масса примеров (ВКонтакте, Твиттер, Фейсбук, Всемирный банк...). На сайте автора (гуглим по названию книги) есть код и куча дополнений к тексту. Выкладываю оглавление

    0
    0
Зарегистрируйтесь и получайте бонусы за покупки!



закладки (0) сравнение (0)