Yandex Datalens

Yandex DataLens это сервис визуализации и анализа данных от Yandex Cloud. В нем можно рисовать диаграммы, строить таблицы и объединять несколько визуализаций в один дашборд. Затем на дашборде можно отслеживать выбранные показатели бизнеса.

Внимание! Эта статья для руководителей клиентского сервиса, которые хотят лучше узнать своих клиентов и положение дел в компании. Статья не подойдет data-science специалистам и опытным аналитикам мы расскажем только общие принципы использования сервиса.

 

  1. Интерфейс DataLens
  2. Вкладка "Подключения"
  3. Вкладка "Датасет"
  4. Вкладка "Чарты"
  5. Вкладка "Дашборды"
  6. Как поделиться дашбордом

 

Сначала ознакомимся с интерфейсом в целом, а затем перейдем к сбору статистики, построению графиков и созданию дашбордов.

Чтобы сделать обзор более понятным, разберем основные термины:

Подключение: это набор параметров для доступа к источнику данных, которым может быть база данных ClickHouse, Excel-таблица, Google-таблица, счетчик Яндекс.Метрики и другие. В этой статье мы будем загружать .csv файл, ранее выгруженный из отчётов HelpDeskEddy.

Датасет: описание набора данных из источника. Это может быть статистика по количеству заявок, времени ответа, распределению по категориям обращений и т.д.

Чарт: визуализация данных из источника или датасета в виде таблиц, диаграмм и карт.

Дашборд: набор чартов, селекторов для фильтрации данных и текстовых блоков. Дашборд можно представить как лист с размещенными на нём визуальными элементами или виджетами. Он может содержать заголовок, графики, объединенные по смыслу, фильтры для изменения представления данных и поясняющие тексты.

Когда зарегистрируетесь в сервисе, попадете на главную страницу. Слева вы увидите панель управления с различными вкладками:

  • «Все сервисы» — здесь можно перейти в другие сервисы Яндекса.
  • «Все объекты» — здесь хранятся ваши папки, таблицы, базы данных и диаграммы. Под каждый новый проект рекомендуем создавать отдельную папку и хранить информацию по каждой визуализации отдельно.
  • «Избранное» — здесь лежат избранные проекты.
  • «Подключения» — здесь можно посмотреть, к каким базам данным вы подключились или какие таблицы загрузили.
  • «Датасеты» — здесь собраны все ваши данные.
  • «Чарты» — здесь лежат построенные диаграммы.
  • «Дашборды» — здесь хранятся все ваши дашборды.
  • «Личная папка» — здесь хранятся именно ваши проекты, с которыми вы работали.
  • «Marketplace» — здесь лежат готовые чарты, диаграммы, дашборды и другие полезные файлы, которые вы можете бесплатно установить и использовать как шаблон отчета или визуализации.
  • «Настройки сервиса» — здесь можно добавлять новых пользователей в команду и настраивать цвета чартов.
     

По сути все эти вкладки нужны потом, когда у вас уже будет несколько подключений, чартов и дашбордов, чтобы переключаться между ними. Если вы работаете с данными в первый раз, через все этапы создания можно пройти через главную страницу. Вернемся к ней:

 

Идти по вкладкам нужно по порядку: от подключения к дашбордам.

 

2. Вкладка "Подключения"

 

Здесь вы можете выбрать источник данных:

 

В нашем примере мы будем работать с вкладкой "Файлы и сервисы" и загружать .csv файл. В качестве источника данных мы сформировали отчёт в HelpDeskEddy с интересующими нас параметрами, а затем вызгрузили его в .csv файл. Через хелпдеск вы можете выгружать любой отчёт в этом формате, а подробнее с отчётами можно ознакомиться в нашей базе знаний.

В блоке «Файлы и сервисы» выберите пункт «Файлы», в открывшемся окне кликните на «Загрузить файл» (выбрать таблицу только в CSV-формате), а затем — «Создать подключение»:

 

3. Вкладка "Датасет"

 

В этой вкладке можно формировать наборы данных из тех файлов, которые вы загрузили в подключении.

Для этого нужно выбрать подключение (в нашем случае это таблица, которую мы загрузили на прошлом этапе):

 

На вкладке «Таблицы» автоматически появится файл с вашей информацией, а внизу — предпросмотр будущего датасета:

 

Работать с разделом нужно так: в разделе «Таблицы» первой выбираете главную таблицу (если их несколько) и переносите ее в рабочую область. А затем на иконку первой таблицы перетягиваете другие, данные из которых хотите отразить в отчете.

 

Внимание! Между таблицами автоматически установится связь по первому совпадению имен и типами данных полей. Установить связь можно только по полям с одним и тем же типом данных. Например, если в одной таблице у вас данные о возрасте клиентов, а в другой — количество заявок каждого за год.

Чтобы проверить, по каким полям создавалась связь, нужно нажать на два пересекающихся круга. Откроется диалоговое окно, в котором можно изменить поля связи.

 

В разделе «Датасеты» есть и другие вкладки:

  • поля;
  • параметры;
  • фильтрация.

На вкладке «Поля» можно выбрать, как агрегировать данные. При этом поля данных в датасете могут быть двух типов:

  • «Измерения». Это качественные данные. Например, клиенты, товары, заказы. Они нужны для создания фильтров и группировок. В интерфейсе обозначаются зелёным цветом.
  • «Показатели». Это количественные данные. Например, число или сумма заказа. В интерфейсе отображаются синим цветом.

Для всех полей данных можно задавать тип:

  • целое число;
  • дробное число;
  • строка — текстовая строка, которая задается с помощью одинарных или двойных кавычек;
  • дата — информация о дате без учета времени;
  • дата и время — информация о дате с учетом времени;
  • логический — предусматривает значения TRUE или FALSE;
  • геоточка — координаты по широте и долготе;
  • геополигон — множество геоточек;
  • массив — последовательность значений одного типа: строчного, целочисленного или дробного.

Главное — присваивать данным соответствующие типы. Правила соответствия читайте в справке DataLens.

 

Если с таблицей все ок, в правом верхнем углу нужно кликнуть на «Сохранить»:

 

4. Вкладка "Чарты"

 

После того, как вы сохранили таблицу, рядом с кнопкой «Сохранить» можно кликнуть на «Создать чарт» и вас автоматически перенаправит на создание диаграммы:

 

В новом окне вы увидите все содержимое таблицы под названием «Измерения» и «Показатели»:

 

Чтобы собрать диаграмму, нужно перетаскивать значения из столбцов «Измерения» и «Показатели» в соседний столбец. 

Например, у линейной диаграммы есть секции X и Y, которые принимают разные данные:

  • Секция X принимает на вход одно поле и чаще всего это поле — измерение.
     
  • Секция Y принимает на вход как минимум один показатель.

Начнем строить. Мы для примера сделаем столбчатую диаграмму и узнаем количество заявок, обработанные всеми департаментами:

 

Дальше диаграмму можно улучшать и делать более удобной. Например, можно сделать разбивку по цвету. Для этого нужно перетащить нужное измерение в раздел «Цвет», дальше система сделает все сама:

 

Еще диаграмму можно сортировать по тем измерениям, которые мы в нее добавили. Например, можно оставить заявки созданные только за определенный период:

 

Потом можно добавить дополнительные подписи на диаграмму. Выбирать можно любые из столбца «Измерения». Мы для примера добавили на диаграмму количество заявок, обработанные каждым департаментом:

 

Затем созданную диаграмму нужно сохранить, кликнув на кнопку «Сохранить» в правом верхнем углу экрана. Название у нее будет такое же, как название у датасета.

Кроме диаграмм в DataLens можно строить таблицы или просто выводить какие-то числа на экран. Это удобно, если у вас обновляемая база данных — вы сможете нарисовать все нужные диаграммы, таблицы и др. в DataLens и следить за изменениями.

 

Вот несколько рекомендаций от Datalens чтобы понять, какая визуализация данных нужна в разных ситуациях:

Задача    

Что лучше подходит

Отследить динамику. Например, проверить продажи на сезонность или понять, как растут продажи по дням. Графики, потому что они лучше всего отображают изменение во времени. Например, линейный график.
Увидеть конкретные числа или сравнить их между собой. Например, как отличается конверсия по разным клиентам или как менеджеры справляются в планом.    Линейчатые или столбчатые графики.
Протестировать гипотезу. Например, проверить корреляцию между количеством заказов и затратами на рекламу.    Точечные и столбчатые графики.
Найти долю от целого. Например, понять, какой процент от планируемого выполнили менеджеры или какой процент продаж приходится на конкретные товары.    Круговая или кольцевая диаграммы, которые показывают процентное отношение.
Получить конкретное значение или выгрузить данные. Например, сколько продаж было или какой тип оплаты выбирали клиенты.   Таблица.
Если необходимо показать одно ключевое значение.Индикатор.

 

5. Вкладка "Дашборды"

 

Теперь попробуем создать дашборд с разными видами диаграмм. Для этого нужно выбрать вкладку «Дашборды» в панели управления слева → «Создать дашборд». Назовите его и кликните на «Создать».

Затем нажмите на «Добавить» по центру экрана и выберите одну диаграмму.

Внимание! Не нужно выбирать сразу все диаграммы — сервис добавит только первую выбранную.

У нас в итоге получился такой дашборд:

 

А если у вас будет больше информации о компании, то собрать можно будет более информативный и полезный дашборд. Такой дашборд есть в демо-версии Даталенс:

 

6. Как поделиться дашбордом

 

Когда подготовите дашборд, можете опубликовать его в интернете и показывать кому угодно. Для этого нажмите на «…» в левом верхнем углу экрана → «Публичный доступ» → перетащите ползунок напротив «Текущий объект». Затем настройте доступ для чартов, датасетов и подключений, которые используются в этом дашборде.

После этого копируйте ссылку на дашборд и жмите «Применить»:

 

В статье мы рассказали о базовых моментах работы с сервисом. На самом деле возможностей у DataLens больше, но на рассказ обо всем уйдет не одна статья. Поэтому рекомендуем отдельно поизучать курсы от Яндекса — там обо всем рассказывают подробно и наглядно: основы работы с DataLens.