Yandex DataLens – это сервис визуализации и анализа данных от Yandex Cloud. В нем можно рисовать диаграммы, строить таблицы и объединять несколько визуализаций в один дашборд. Затем на дашборде можно отслеживать выбранные показатели бизнеса.
Внимание! Эта статья для руководителей клиентского сервиса, которые хотят лучше узнать своих клиентов и положение дел в компании. Статья не подойдет data-science специалистам и опытным аналитикам – мы расскажем только общие принципы использования сервиса.
- Интерфейс DataLens
- Вкладка "Подключения"
- Вкладка "Датасет"
- Вкладка "Чарты"
- Вкладка "Дашборды"
- Как поделиться дашбордом
Сначала ознакомимся с интерфейсом в целом, а затем перейдем к сбору статистики, построению графиков и созданию дашбордов.
Чтобы сделать обзор более понятным, разберем основные термины:
Подключение: это набор параметров для доступа к источнику данных, которым может быть база данных ClickHouse, Excel-таблица, Google-таблица, счетчик Яндекс.Метрики и другие. В этой статье мы будем загружать .csv файл, ранее выгруженный из отчётов HelpDeskEddy.
Датасет: описание набора данных из источника. Это может быть статистика по количеству заявок, времени ответа, распределению по категориям обращений и т.д.
Чарт: визуализация данных из источника или датасета в виде таблиц, диаграмм и карт.
Дашборд: набор чартов, селекторов для фильтрации данных и текстовых блоков. Дашборд можно представить как лист с размещенными на нём визуальными элементами или виджетами. Он может содержать заголовок, графики, объединенные по смыслу, фильтры для изменения представления данных и поясняющие тексты.
Когда зарегистрируетесь в сервисе, попадете на главную страницу. Слева вы увидите панель управления с различными вкладками:
- «Все сервисы» — здесь можно перейти в другие сервисы Яндекса.
- «Все объекты» — здесь хранятся ваши папки, таблицы, базы данных и диаграммы. Под каждый новый проект рекомендуем создавать отдельную папку и хранить информацию по каждой визуализации отдельно.
- «Избранное» — здесь лежат избранные проекты.
- «Подключения» — здесь можно посмотреть, к каким базам данным вы подключились или какие таблицы загрузили.
- «Датасеты» — здесь собраны все ваши данные.
- «Чарты» — здесь лежат построенные диаграммы.
- «Дашборды» — здесь хранятся все ваши дашборды.
- «Личная папка» — здесь хранятся именно ваши проекты, с которыми вы работали.
- «Marketplace» — здесь лежат готовые чарты, диаграммы, дашборды и другие полезные файлы, которые вы можете бесплатно установить и использовать как шаблон отчета или визуализации.
- «Настройки сервиса» — здесь можно добавлять новых пользователей в команду и настраивать цвета чартов.
По сути все эти вкладки нужны потом, когда у вас уже будет несколько подключений, чартов и дашбордов, чтобы переключаться между ними. Если вы работаете с данными в первый раз, через все этапы создания можно пройти через главную страницу. Вернемся к ней:
Идти по вкладкам нужно по порядку: от подключения к дашбордам.
2. Вкладка "Подключения"
Здесь вы можете выбрать источник данных:
В нашем примере мы будем работать с вкладкой "Файлы и сервисы" и загружать .csv файл. В качестве источника данных мы сформировали отчёт в HelpDeskEddy с интересующими нас параметрами, а затем вызгрузили его в .csv файл. Через хелпдеск вы можете выгружать любой отчёт в этом формате, а подробнее с отчётами можно ознакомиться в нашей базе знаний.
В блоке «Файлы и сервисы» выберите пункт «Файлы», в открывшемся окне кликните на «Загрузить файл» (выбрать таблицу только в CSV-формате), а затем — «Создать подключение»:
3. Вкладка "Датасет"
В этой вкладке можно формировать наборы данных из тех файлов, которые вы загрузили в подключении.
Для этого нужно выбрать подключение (в нашем случае это таблица, которую мы загрузили на прошлом этапе):
На вкладке «Таблицы» автоматически появится файл с вашей информацией, а внизу — предпросмотр будущего датасета:
Работать с разделом нужно так: в разделе «Таблицы» первой выбираете главную таблицу (если их несколько) и переносите ее в рабочую область. А затем на иконку первой таблицы перетягиваете другие, данные из которых хотите отразить в отчете.
Внимание! Между таблицами автоматически установится связь по первому совпадению имен и типами данных полей. Установить связь можно только по полям с одним и тем же типом данных. Например, если в одной таблице у вас данные о возрасте клиентов, а в другой — количество заявок каждого за год.
Чтобы проверить, по каким полям создавалась связь, нужно нажать на два пересекающихся круга. Откроется диалоговое окно, в котором можно изменить поля связи.
В разделе «Датасеты» есть и другие вкладки:
- поля;
- параметры;
- фильтрация.
На вкладке «Поля» можно выбрать, как агрегировать данные. При этом поля данных в датасете могут быть двух типов:
- «Измерения». Это качественные данные. Например, клиенты, товары, заказы. Они нужны для создания фильтров и группировок. В интерфейсе обозначаются зелёным цветом.
- «Показатели». Это количественные данные. Например, число или сумма заказа. В интерфейсе отображаются синим цветом.
Для всех полей данных можно задавать тип:
- целое число;
- дробное число;
- строка — текстовая строка, которая задается с помощью одинарных или двойных кавычек;
- дата — информация о дате без учета времени;
- дата и время — информация о дате с учетом времени;
- логический — предусматривает значения TRUE или FALSE;
- геоточка — координаты по широте и долготе;
- геополигон — множество геоточек;
- массив — последовательность значений одного типа: строчного, целочисленного или дробного.
Главное — присваивать данным соответствующие типы. Правила соответствия читайте в справке DataLens.
Если с таблицей все ок, в правом верхнем углу нужно кликнуть на «Сохранить»:
4. Вкладка "Чарты"
После того, как вы сохранили таблицу, рядом с кнопкой «Сохранить» можно кликнуть на «Создать чарт» и вас автоматически перенаправит на создание диаграммы:
В новом окне вы увидите все содержимое таблицы под названием «Измерения» и «Показатели»:
Чтобы собрать диаграмму, нужно перетаскивать значения из столбцов «Измерения» и «Показатели» в соседний столбец.
Например, у линейной диаграммы есть секции X и Y, которые принимают разные данные:
- Секция X принимает на вход одно поле и чаще всего это поле — измерение.
- Секция Y принимает на вход как минимум один показатель.
Начнем строить. Мы для примера сделаем столбчатую диаграмму и узнаем количество заявок, обработанные всеми департаментами:
Дальше диаграмму можно улучшать и делать более удобной. Например, можно сделать разбивку по цвету. Для этого нужно перетащить нужное измерение в раздел «Цвет», дальше система сделает все сама:
Еще диаграмму можно сортировать по тем измерениям, которые мы в нее добавили. Например, можно оставить заявки созданные только за определенный период:
Потом можно добавить дополнительные подписи на диаграмму. Выбирать можно любые из столбца «Измерения». Мы для примера добавили на диаграмму количество заявок, обработанные каждым департаментом:
Затем созданную диаграмму нужно сохранить, кликнув на кнопку «Сохранить» в правом верхнем углу экрана. Название у нее будет такое же, как название у датасета.
Кроме диаграмм в DataLens можно строить таблицы или просто выводить какие-то числа на экран. Это удобно, если у вас обновляемая база данных — вы сможете нарисовать все нужные диаграммы, таблицы и др. в DataLens и следить за изменениями.
Вот несколько рекомендаций от Datalens чтобы понять, какая визуализация данных нужна в разных ситуациях:
Задача | Что лучше подходит |
---|---|
Отследить динамику. Например, проверить продажи на сезонность или понять, как растут продажи по дням. | Графики, потому что они лучше всего отображают изменение во времени. Например, линейный график. |
Увидеть конкретные числа или сравнить их между собой. Например, как отличается конверсия по разным клиентам или как менеджеры справляются в планом. | Линейчатые или столбчатые графики. |
Протестировать гипотезу. Например, проверить корреляцию между количеством заказов и затратами на рекламу. | Точечные и столбчатые графики. |
Найти долю от целого. Например, понять, какой процент от планируемого выполнили менеджеры или какой процент продаж приходится на конкретные товары. | Круговая или кольцевая диаграммы, которые показывают процентное отношение. |
Получить конкретное значение или выгрузить данные. Например, сколько продаж было или какой тип оплаты выбирали клиенты. | Таблица. |
Если необходимо показать одно ключевое значение. | Индикатор. |
5. Вкладка "Дашборды"
Теперь попробуем создать дашборд с разными видами диаграмм. Для этого нужно выбрать вкладку «Дашборды» в панели управления слева → «Создать дашборд». Назовите его и кликните на «Создать».
Затем нажмите на «Добавить» по центру экрана и выберите одну диаграмму.
Внимание! Не нужно выбирать сразу все диаграммы — сервис добавит только первую выбранную.
У нас в итоге получился такой дашборд:
А если у вас будет больше информации о компании, то собрать можно будет более информативный и полезный дашборд. Такой дашборд есть в демо-версии Даталенс:
6. Как поделиться дашбордом
Когда подготовите дашборд, можете опубликовать его в интернете и показывать кому угодно. Для этого нажмите на «…» в левом верхнем углу экрана → «Публичный доступ» → перетащите ползунок напротив «Текущий объект». Затем настройте доступ для чартов, датасетов и подключений, которые используются в этом дашборде.
После этого копируйте ссылку на дашборд и жмите «Применить»:
В статье мы рассказали о базовых моментах работы с сервисом. На самом деле возможностей у DataLens больше, но на рассказ обо всем уйдет не одна статья. Поэтому рекомендуем отдельно поизучать курсы от Яндекса — там обо всем рассказывают подробно и наглядно: основы работы с DataLens.