Дмитрий Храмов | Сбор данных в Интернете на языке R (+code) (2017) [PDF]
Автор: Дмитрий Храмов
Издательство: ДМК Пресс
ISBN: 978-5-97060-459-5
Жанр: Информационные технологии
Формат: PDF
Качество: Хороший скан
Иллюстрации: Цветные и черно-белые
Описание:Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п.
Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R – описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.
Скриншоты:
Время раздачи: Пн-Пт с 18:00 до 22:00, Сб-Вс с 18:00 до 23:30 (до появления первых 3-5 скачавших)