- Руководства по пользованию программами
- Операционные системы и утилиты для ПК
- Интернет
- Графика. Дизайн. Проектирование
- Программы и утилиты для цифровых устройств
- Железо ПК
- Информатика
- Сети и коммуникации
- Бухгалтерия
- Базы данных
- Анализ данных
- Электронная бухгалтерия
- Машинное обучение. Анализ данных
- Менеджмент в IT
Сбор данных в Интернете на языке R; ДМК Пресс, 2017
1290 грн.
- Издатель: ДМК-Пресс
- ISBN: 978-5-97060-459-5
EAN: 9785970604595
- Книги: Программирование
- ID: 1777798
Описание
Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.
Видео Обзоры (5)
Язык R для интернет маркетинга: 1.1. История создания и назначение языка R
Анализ данных с применением языка и среды для статистической обработки данных R
СРОЧНО ОТКЛЮЧИ ЭТИ НАСТРОЙКИ НА СВОЕМ СМАРТФОНЕ! ХИТРОСТЬ РАЗРАБОТЧИКОВ ПРО СБОР ЛИЧНЫХ ДАННЫХ
Импорт (парсинг) нетабличных данных с сайтов в Excel с помощью Power Query
Доклад: Как работать с API Google Analytics на языке R с помощью пакета googleAnalyticsR (8P Online)
Характеристики (25)
Параметр | Значение |
---|---|
Автор(ы) | Храмов Дмитрий Александрович |
Переплет | 200.00mm x 140.00mm x 16.00mm |
Издатель | ДМК Пресс |
Год издания | 2017 |
Возрастные ограничения | 12 |
Кол-во страниц | 282 |
Вес, в граммах | 290 |
Издательство | ДМК Пресс |
Тип обложки | мягкая |
Количество страниц | 282 |
Назначение | для технических ВУЗов |
Количество книг | 1 |
Оформление обложки | лакировка |
Автор | Храмов Дмитрий Александрович |
Формат | 20 x 14.1 x 1.3 |
Раздел | Программирование |
ISBN | 978-5-97060-459-5 |
Вес | 0.29кг |
Размеры | 21,50 см × 14,50 см × 1,40 см |
Обложка | мягкая обложка |
Язык издания | rus |
Страниц | 280 |
Переплёт | мягкий |
Тематика | Программирование |
Возрастное ограничение | 16+ |
Цены (1)
Цена от 1290 грн. до 1290 грн. в 1 магазинах
Магазин | Цена | Наличие |
---|---|---|
Купить в кредит (2)
Компания | Предложение |
---|---|
Полезные онлайн-сервисы
Компания | Предложение |
---|
Отзывы (6)
- Alexander Baklanov — 16 Декабря 2017
Не вполне согласен с Raniod’ом. Некоторые книги интересно читать, не зная основ. Язык R не изучают на каждом углу. Отсюда, книга – на крепкую четверку. Прочитаю – поставлю выше. Все, что относится к BI, нужно брать при реальном количестве полезной информации более 10% (выше ошибки опыта).
00 - Ilyasikm — 30 Октября 2019
Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!
00 - Илья Слугин — 21 Октября 2021
Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.
Только для опытных пользователей R, которым надо работать с сайтами.
Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что00 - ranlod — 23 Августа 2017
Данную книгу не стоит считать «полным» руководством по сбору данных в интернете. Она скорее как базовый справочник по технологиям сбора с помощью R, поскольку в книге даны простые примеры по каждому пакету, чуть более сложные или спецефичные ситуации всё равно придётся гуглить на иностранных ресурсах, некоторые аспекты выгрузки вообще пропущенны, напр управление куками и их сохранение. Книга лишь позволит быстро сориентировать какой пакет стоит использовать.
Кстати из 280 стр только 180 относятся к сбору данных, первые 100 стр это рассказывание про синтаксис R, не очень понятно зачем они нужны, т.к человек интересующийся выгрузкой из сети с помощью R по определению уже знает синтаксис, раз задаётся такими прикладными вопросами. Эти 180 стр можно вдумчиво прочитать за 2 вечера.
В общем поставлю 4 из 5 и то из-за того что на русском и даёт быстрое представление о способах выгрузки, без гугления на иностранных ресурсах. Но объективно, по содержанию, это скорее 3 за 180 стр, особенно если по цене бумажного варианта(900 р)00 - Vadim Volokzhanin — 29 Апреля 2017
Книга в концентрированном виде информация об извлечении данных преимущественно из сети Internet по средствам языка R. В самом начале книги идет отсылка к BI (Business Intelligence) не как значению «бизнес-анализ» в широком смысле слова, а к значению «бизнес-разведка». Значение слова «разведка» (Intelligence) следует рассматривать не столько как слежение за конкурентами, сколько как отслеживание собственных внутренних бизнес-процессов организации. Автор справедливо замечает, что сбор данных это основа для «data mining» в общем смысле данного определения.
Отличием книги является наличие в каждой главе списка литературы, откуда можно узнать более детальную информацию по темам главы.00 - Иван — 23 Ноября 2016
Годная книга, масса примеров (ВКонтакте, Твиттер, Фейсбук, Всемирный банк...). На сайте автора (гуглим по названию книги) есть код и куча дополнений к тексту. Выкладываю оглавление
00