Поскольку для Мерку мы делаем очень много с точки зрения аналитики, я буду писать небольшие посты про то, как строить графики и анализировать данные. Кстати, если вы не имеете ни малейшего понятия, как можно визиуализировать данные, можно начать смотреть на этом замечательном ресурсе.
Для анализа данных и того, чтобы понять собственно, что за эти данными скрывается было придумано очень много сложных и не очень инструментов. Нас интересуют самые основные библиотеки, которые применяются при анализа данных при помощи Пайтона: NumPy, SciPy, Matplotlib и Pandas. При помощи них мы познакомимся с тем, с чего начинается любое исследование – посмотрим на имеющиеся данные и попытаемся понять, с чем имеем дело. В англоязычной литературе это называется Exploratory Analysis. При написании этого поста я нашёл несколько IPython конспектов, на основе которых и оформляю этот пост. Ссылки на них приведены в конце.
Немного позже я переведу и дополню посты, которые рассматривают все манипуляции с данными, а также различные статистики, которые бывает полезно изучить, прежде чем пытаться что-то анализировать.
Если что-то отображается некорректно, то можно посмотреть оригинальный html файл или сгенерировать его из ipynb исходника.
Источники:
matplotlib – 2D and 3D plotting in Python
Exploratory Data Analysis and Statistics using Pandas and Matplotlib
Другие полезные статьи по работе с данными в Python
Манипуляция и обработка данных в Python (Data wrangling and munging)
Шпаргалка по статистическому анализу
Анализ данных при помощи Python. Основные статистики и обзор данных (Exploratory Analysis)
Анализ данных при помощи Python. Основные статистики и обзор данных (Exploratory Analysis) часть 2
Comments are closed.