Подходы к анализу данных с помощью визуализации
НЕДЕЛЯ 3
Продолжаем Марафон!
Отлично движемся! Переходим на третью неделю Марафона и начинаем подробное знакомство с видами визуализации данных: диаграммами и графиками.

Посмотрим на типовые примеры и разберем основные виды сравнения, научимся выбирать корректный вид визуализации под свою задачу, а также поймем для чего нужны Ключевые Показатели Эффективности (КПЭ).

Закончим неделю погружением в формульные расчеты в Qlik Sense — никто не уйдет без новых знаний.

Продолжаем путь!
Присоединяйтесь к телеграм-чату
Чтобы пообщаться с коллегами, спросить совета, узнать мнение экспертов Марафона и найти ответы на свои вопросы
Типы графиков и диаграмм
Знаете ли вы сколько существует типов графиков и диаграмм? 20, 50, 100? Можно придумать огромное количество видов визуализации данных, каждый из которых будет полезен.

При этом, как мы рассматривали на первой неделе Марафона, каждый тип визуализации призван отвечать на свой вопрос, выполняя определенную задачу. Нужно уметь подбирать наиболее подходящий.

Посмотрим на основные виды сравнения данных — и типы графиков и диаграмм, которые под них подходят.
Сравнение категорий
Позволяют продемонстрировать сходства или различия по категориям. В этом виде сравнения основное — это заметить разницу и понять, насколько она велика или мала.

Для сравнения категорий используют столбиковые диаграммы в разных вариациях. А еще столбцы обычно сортируют по убыванию или возрастанию величины — это упрощает сравнение.
Соотношение категорий
Используют объем или пространство визуализации для отображения возможных взаимосвязей между двумя показателями.

Классический пример — точечная (или пузырьковая) диаграмма, которая показывает наличие или отсутствие зависимости двух переменных.
Части целого
Показывают, как нечто цельное делится на составные части.

Используются такие диаграммы как круговая, древовидная и накопительные линейчатые диаграммы. Обычно сегменты показателя (его части) также сортируют от большего к меньшему, чтобы визуально упростить считывание данных.
Распределение величины
Отображают частотность и распределение данных в пределах определенного интервала или по выделенным группам.

Классический пример — гистограмма, в котором каждая полоса на гистограмме представляет частотность значения за определенный интервал — то есть, сколько раз то или иное наблюдение встречается в данных.
Изменение во времени
Показывают изменение показателя во времени — основную роль тут играет наличие поля с датой по оси Х.
Изменение на местности
Показывают изменение показателя на местности. Используют карты, на которых откладываются точки координат или географические слои. Сам показатель может выражаться при помощи фоновой заливки элементов карты (областей) или с помощью точек разного размера.
Для того, чтобы проще ориентироваться в видах диаграмм и графиков, ДатаЙога подготовила свою коллекцию визуализаций с подборкой советов по применению и типизацией по видам сравнения.

Задавайте вопросы к данным и подбирайте визуализации под ваши задачи. Определитесь с типом сравнения данных, изучите плюсы и минусы каждой визуализации и прислушайтесь к тщательно подобранным советам.
Открыть коллекцию визуализаций
Интерактивный сайт с видами графиков и диаграмм. Можно кликнуть на любую карточку, чтобы прочитать описание диаграммы и советы по её применению
Как подбирать графическое представление данных для своих проектов?
Одни и те же данные можно показать разными способами, в зависимости от вопроса и конечной цели. Поэтому, не имея вопроса, подбирать вид диаграммы под имеющиеся данные можно довольно долго.

Например,
→ Если хотим показать тенденцию изменения двух категорий во времени, выберем линейный график
→ Если хотим показать тенденцию изменения, но при этом важен накопительный эффект, покажем динамику в графике с накоплением
→ Если хотим просто показать само изменение в двух точках, выберем график было-стало
→ Если важно показать суммарный эффект по двум категориям с акцентом на баланс в каждом месяце, сделаем выбор в пользу столбиковой диаграммы с накоплением
→ Если хотим показать сравнение двух категорий в разрезе каждого месяца, выберем столбиковую диаграмму, где столбцы будут находиться рядом друг с другом
→ Если важно показать разницу между двумя категориями, сделаем выбор в пользу диаграммы наклона по каждому месяцу
→ Если хотим показать характер разницы между двумя категориями, то добавим цвет и сделаем акцент

Выбор визуализации – начинается с вопроса. Что я хочу показать? На чем я хочу сделать акцент? Что диаграмма должна донести?

Чтобы облегчить задачу выбора подходящей диаграммы придуманы специальные помощники: чарт-чузеры. Это визуальные справочники, которые объединяют множество доступных видов визуализации, сгруппированных по целям использования. Ставьте вопрос, выбирайте тип сравнения, необходимый вам, и подходящую визуализацию.

Мы собирали доступные чарт-чузеры на специальной доске Miro.
Открыть карту визуализации
Подборка каталогов визуализации данных, графиков и диаграмм
Для чего нужны KPI?
KPI — Key Performance Indicator — или Ключевой Показатель Эффективности. KPI отражают наиболее важные метрики на разных уровнях компании: либо для всей организации в целом, либо для ее департаментов, отделов или конкретных сотрудников.
KPI отслеживаются на постоянной основе, должны быть измеряемы и иметь решающее значение для достижения целей компании и поддержания роста.

KPI высокого уровня демонстрируют общую эффективность компании, в то время как KPI низкого уровня фокусируются на более узких целях, например, KPI для продаж или проекта показывают производительность отдельных бизнес-подразделений.
Часто отслеживаемые KPI могут быть такими...
Часто отслеживаемые KPI могут быть такими:

→ Темпы роста выручки
→ Чистая прибыль
→ Коэффициент оттока (сколько человек перестают пользоваться продуктом или услугой)
→ Средний доход для каждого клиента
→ Срок жизни клиента (CLV / LTV)

Существуют целые сервисы-каталоги со списком KPI. Вы можете изучить их здесь и здесь.

Определив эти показатели в начале, вы поймете, чего пытаетесь достичь. Выбирайте только нужные метрики, которые ценны и полезны для выбранных задач. Отделите руду от полезных KPI.

Знание KPI, которые вам или вашим заказчикам нужно отслеживать, поможет определить цель будущих визуализаций – найти ответ на вопрос какую бизнес-проблему вы пытаетесь решить?

Визуализация может отвечать на большое количество разных вопросов одновременно. Но лучше оставить только самое необходимое.

Определитесь и выберите топ-3 конечных цели, которые должен решать будущий дашборд с диаграммами, например:
→ сообщать о последних достижениях
→ ставить цели для конкретных сотрудников или отделов
→ содействовать определенным действиям время от времени
→ сообщать о экстренных ситуациях, сбоях, отклонению от плана
→ предоставлять общую сводную "картину бизнеса" для руководителей
→ помогать менеджерам планировать процессы и акцентировать внимание
→ выступать в роли интерфейса к базе данных

Правильно подобранный KPI помогает менеджерам ориентироваться между важными бизнес-процессами и показывает, может ли организация достичь своих ключевых целей.

Визуальное представление KPI
KPI является мощной точкой входа на любых слайдах и дашбордах. Значение KPI легко сравнивать в динамике, особенно если аудитория часто к нему обращается и знает все ключевые цифры практически наизусть.

Тем не менее, показатели лучше сопровождать такой информацией как:
  • название показателя
  • размерность
  • целевое значение (план)
  • значение прошлого периода (дня, недели, года)
  • динамика изменения во времени

Покажем вам наиболее три самых частых способа визуализации ключевых показателей эффективности.
Способ 1. Просто большая цифра

Примеры отображения показателей в виде просто большой цифры просты и понятны. Обычно, цифра сопровождается цветом или символом тренда, который показывает в худшую или в лучшую сторону изменился показатель.

Это простые визуализации, которые эффективны в случае если аудитория хорошо знакома с показателем. Их недостаток — отсутствие контекста, истории, сложность проводить сравнения и видеть тренды. Цифра показывает состояние «здесь и сейчас», и сложно сказать насколько сильно было изменение и что происходило раньше. Нехватка контекста.
Способ 2. Обогащение контекста

На таких визуализациях, кодирование величины показателя в визуальную форму (столбец, линия, направление, угол) облегчает процесс сравнения и сопоставления нескольких показателей/ или плана с фактом. В некоторых примерах гораздо удобнее видеть исторические данные по показателю, чем в случае с Просто большой цифрой.

Способ 3. Сложные визуализации

Эти визуализации выглядят многослойнее, некоторые из них могут быть непонятны аудитории. Однако, их цель — предоставить еще больше данных для оценки показателя на минимальном пространстве. Используя их, нужно хорошо знать свою аудиторию: все ли поймут эти диаграммы?

Знакомство с Qlik Sense
Современный BI-инструмент анализа данных
Что такое BI-инструмент и что такое Qlik Sense?
BI — от англ. Business Intelligence — это целый класс инструментов для визуального анализа данных.

С помощью BI-инструмента вы можете:
01 Подключиться к необходимым данным, уже готовым или загрузить свои
02 Провести наглядный анализ данных с помощью диаграмм и графиков
03 Сделать необходимые вычисления и преобразования, в том числе отфильтровать данные или модифицировать
04 Собрать диаграммы на одном экране — на дашборде — для удобства сквозного анализа
05 Презентовать, показать и рассказать о своих данных — или лучше понимать их для себя

Qlik Sense — BI-инструмент для анализа и визуализации данных.
Обзор Qlik Sense на русском языке
Если вы хотите обучиться работе в инструменте Qlik Sense, чтобы работать с данными по-новому, то для начала необходимо понять, чему учиться. Вы можете работать с данными как потребители аналитики или как ее создатели.

→ Потребители аналитики (Аналитики) — работают с уже готовыми аналитическими приложениями, дашбордами, получают визуализации и отчеты из аналитических систем. При этом они ограничены в функционале, не могут создавать новые отчетные формы на уже имеющихся данных, не могут создавать новые аналитические приложения. Работа аналитика требует лицензии Analyzer.

→ Создатели аналитических приложений (Разработчики) — работают как с уже созданными приложениями, добавляя в них новые дашборды, визуализации и метрики, так и создают полностью новые приложения на основании своих источников данных. Работа создателя приложений требует лицензии Professional. Действия, описанные в разделе «Аналитика за 100 секунд», будут требовать лицензии Professional.
Где учиться?
Если возникают вопросы по обучению и вам нужна помощь — задавайте вопросы в чате!
Пишите вопросы в телеграм-чате
Эксперты Марафона будут рады вам ответить!
Вычисления и формулы на кончиках пальцев
Возможности настройки пользовательских вычислений и дополнительных расчетов в Qlik Sense поражают: арсенал доступных встроенных функций велик. Рассказываем вам о возможностях программы для формирования первого впечатления.
Вычисление — это любой пользовательский алгоритм расчета нового поля на основе уже имеющихся в источнике. Основа вычислений заключается в функциях. Функции используются для выполнения математических, логических, проверочных и множества других видов операций над данными в памяти продукта.
Например, если у вас в источнике данных есть поля «Выручка» и «Количество товаров», вы сможете посчитать среднюю выручку на один товар, поделив эти два показателя друг на друга. Это будет вашим новым вычислением, а выражение: [Выручка] / [Количество товаров] — вашей формулой.
Так выглядит редактор выражений в Qlik Sense
Функции в Qlik Sense поделены на смысловые категории.

В основные группы можно выделить функции:
  • Логические
  • Строковые
  • Даты и времени
  • Агрегирования
  • Условий
  • Финансовые

Также есть функции по работе с NULL-значениями, форматирования, ранжирования, цвета, функции вероятности, логарифмов, статистики и много других. Большое количество функций позволяет вам гибко общаться с данными, но не пугайтесь их количества. В процессе работы вы быстро определите для себя самые полезные, подходящие под ваши задачи и будете быстро ориентироваться в списке функций благодаря поиску.
Подробно о вычислениях и функциях
В дне открытого Марафона DataYoga по работе с Qlik

Игорь Буробин
Консультант в области анализа данных, архитектор BI систем
Предлагаем посмотреть видео-урок по работе в Qlik Sense для понимания принципов работы с вычислениями. Цель видео — понять такие сущности как Выражения и Основные элементы. При знакомстве с Основными элементами, я покажу как составлять несложные меры и делать простые визуализации в Qlik Sense на основе данных Excel.
Полезные ссылки
Что почитать для расширения визуального кругозора