Аналитика в HR
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Департамент организационного поведения и управления человеческими
ресурсами Высшей школы бизнеса НИУ ВШЭ
УПРАВЛЕНИЕ ЧЕЛОВЕЧЕСКИМИ
РЕСУРСАМИ НА ОСНОВЕ ДАННЫХ
Использование данных для обоснованного принятия решений
Мондрус Ольга, Ph.D.
Доцент Департамента ОП&УЧР ВШБ НИУ ВШЭ
Москва, 2020
Департамент организационного поведения и управления человеческими ресурсами
Высшая школа бизнеса НИУ ВШЭ
ЧТО БЫЛО В 1Й СЕССИИ
Определение
People
analytics
Большие
данные в HR
Типы
аналитики
Структура и
источники
данных
Стратегии
сбора
данных
Вопросы
2
Кейсы
Департамент организационного поведения и управления человеческими ресурсами
Высшая школа бизнеса НИУ ВШЭ
Анализ деятельности людей, основанный на данных и
помогающий принимать оптимальные стратегические решения.
Компенсации KPIs Описания
Percentage of Cost of The cost of the workforce as compared to all costs can be
Workforce
summing all salaries and dividing by the total
Культура KPIsmeasured byОписание
company costs within a given period.
Salary Employee Satisfaction
Used to evaluate
competitiveness
of compensation
This isthe
a key
metric underlying
talent retention. Using a company-wide
Competitiveness
options.
Canпоказатели
be determined
by dividing
the average
Описание
Текущие
поhelpful
Index
survey
can be
in gauging
employee happiness.
Ratio (SCR)
company
salary
byunderstand
the averagehow
salary
offered
from
персоналу
KPIs
Number of Employee
Helps
much
effort
is being put into maintaining and
competitors
or Rate
by the rest
of yourGives
industry.
Absenteeism
perspective on the amount of labor and productivity lost due to sickness and
Satisfaction Surveys
improving
employee
happiness.
Healthcare
Expense
Provides an understanding
of theotherwise
comprehensiveness
of leave.
aof company-wide
unpredicted
Formula: (Total number of lost workdays due to
Percent
of Employees
Evaluates the importance
and understanding
per Current
company's health
care plan.culture.
Can be
determined
by taking
absence)
/ (Number
of available workdays in an organization) = (Absenteeism rate)
Trained in Company
organizational
Employee
the
total price
of Time
health care costsKeeps
divided
allthe
employees.
Number
of Full
tabsbyon
growth of the company workforce over time.
Culture
BenefitsPercent
Satisfaction
This
allows
company
seecompany
how satisfied
an employee
is
Employees
of Vacation
Days aHelps
showtothe
attitude
toward a healthy
work-life balance.
with
specific
benefits
they
offered.
Cannumber
be determined
Number
ofDetermined
Contractors
Examines
the
growth
in associated
workers
Used
byare
observing
the
of vacation
days used
as over time. Can be compared to the
through surveys,
and can
be used
to breakofdown
eachworkers to better understand workforce trends.
number
full-time
compared
to those
unused.
benefit
individually.
Average
Tenure
The average length of time that an employee spends with the company helps
Employee
workforce
efficiency
over time.
be
Net PromotorHelps
Scoreto measure
Measures
how likely
an employee
is toCan
recommend
their
determine
employee
satisfaction
andorganization
talent retention.
Productivity Rate
determined
by ataking
total company
revenue
and
as
placethe
to Rate
work.
This
is determined
by the
difference
in employee-led
percentage resignations from the company
Voluntary Termination
Determined
by taking
the
number of
dividing it byofthe
total number
ofover
employees.
promotors
and detractors.
the total number of terminations in a given time period.
Return On
AsInvoluntary
an organization,
you want
to ensure
that the
younumber of employer-led resignations from the company
Termination
Rate
Determined
by dollars
taking the
Investment
are putting into training your employees
paying
off. Can
over theistotal
number
of terminations in a given time period.
beRetirement
defined as Rate
the profit per dollarThis
invested
metricinissocial
particularly important for any organization developing a strategic
compensations/wages.
workforce plan. Can be calculated by looking at the number of employees who retired
as a percentage of the headcount.
Average Age Of Retirement
The summed age of all retiring employees divided by the number of retiring
employees. Being aware of these trends aid in forecasting retirement and planning for
workforce replacement.
New Hire 90-Day Failure Rate Helps determine how successful the talent acquisition process
is at finding the right fit
3
for jobs.
Стандартные метрики
Департамент организационного поведения и управления человеческими ресурсами
Высшая школа бизнеса НИУ ВШЭ
ТИПЫ АНАЛИТИКИ И ИНСТРУМЕНТАРИЙ
Дескриптивная
Диагностическая
Предиктивная
Прескриптивная
Что случилось в Почему это случилось?
Что могло случиться?
Что
должно
прошлом?
случиться?
статистика: Вероятностные
Math and Типы
данных, Базовая
и
Toolkit
Корреляции, регрессии, анализ возможностные модели
номинальные,
- Operations research
вариаций, факторный анализ, продвинутые частотные модели models
упорядочивание
данных, средние, таблицы
сопряженности, и
использование
нечеткой
моды,
медианы, проверка
статистических логики, применения машинного Prescriptive algorithm
отклонения,
показателей (Chi^2 и пр), обучения (с учителем, без of actions
частоты,
попытка
установления учителя, с подкреплением):
отношения, тренды каузальных связей!
анализ текста, нейронные сети,
деревья
решений,
дискриминантый
анализ,
симуляции Монте-Карло
Истории данных и инструментарий: Tableau, MS Excel, SPSS, Stata, Statistica,
NVivo, Miscrosoft, Visual Studio, Matlab, Python, C, R etc,
Microsoft Workplace Analytics, Trustsphere, Keencorp, Yva.ai etc,
UML diagrammes, charts of algorithms and steps of implementation etc
4
ПОДГРУППЫ
Мы должны
ДАННЫХ НА
СОТРУДНИКОВ
использовать эти
данные для моделей
Financial data
Демографические
Часть систем
HRM
Компенсации
Результативность
Logistics data
Мы хотим
знать это
Strategy data
CRM data
Поведенческие
Социальное
взаимодействие
Sales data
Дикая и самая
восхитительная
часть PA
5
Production data
Other data
Департамент организационного поведения и управления человеческими ресурсами
Высшая школа бизнеса НИУ ВШЭ
СТРУКТУРА 2Й СЕССИИ
Базовые
статистический
анализ
Типы данных
Задачки
Вопросы
6
Параметры
количественных и
качественных
исследований
ТИПЫ ДАННЫХ
Категориальные переменные
Номинальные (города, к примеру, названия
департаментов) – кодируют более трех сущностей
Непрерывные переменные
Интервальные – непрерывные значения, которые могут
принимать любое значение, у них нет начальной точки
отсчета, они могут быть и положительными, и
отрицательными.
Бинарные (дихотомические) – две сущности,
есть/нет, активен/уволен, мужской/женский
Отношения - непрерывные значения, определен ноль
(начало отсчета)
Ординальные – более двух сущностей, которые
можно упорядочить, ранжировать (уровень
должности, уровень удовлетворенности)
ЗАВИСИМАЯ И НЕЗАВИСИМЫЕ ПЕРЕМЕННЫЕ
Зависимая
переменная
Категориальная
Категориальная
Независимые переменные
Категориальная одна
Категориальная и/или
непрерывная одна
Категориальная и/или
непрерывная одна
Непрерывная или
ординальная
Непрерывная или
ординальная
Непрерывная или
ординальная
Непрерывная или
ординальная
Тест
χ2 - кросс-табы (таблицы
сопряженности)
Логистическая регрессия
Анализ дожития
Проверка независимости выборок tкритерий Стьюдента, U-критерий Манна
— Уитни
Проверка независимости k выборок
критерий Краскела-Уоллиса
Типы вопросов
определяет, являются ли найденные пропорции или
частоты между категориями случайными или связанными)
попытка предсказать вероятность категориального события
на фоне изменения независимых переменных
проверяет распределение признака по времени между
двумя событиями, можем предсказать дожитие сотрудника
на позиции после 3 месяцев, 6 месяцев, год работы, на
основе независимых переменных.
являются ли выборки данных различными в зависимости от
Бинарная
бинарного признака (непараметрические тесты)
являются ли выборки данных различными в зависимости от
Ординальная
ординального критерия (непараметрические тесты)
проверяет, являются ли данные по одной и той же выборке,
собранные в два разных момента времени различными.
Например, проверка результативности одной и той же
2 категории по времени
двухвыборочный t-test парных выборок команды после первого тренинга, после второго тренинга.
проверяет, различаются ли три и более групп по
категориальная с множеством односторонний независимый ANOVA
непрерывному признаку (вовлеченность в различных
групп
(анализ дисперсии)
департаментах)
ЗАВИСИМАЯ И НЕЗАВИСИМЫЕ ПЕРЕМЕННЫЕ
Зависимая
переменная
Непрерывная или
ординальная
Непрерывная
Непрерывная
Непрерывная или
ординальная
Непрерывная или
ординальная
Непрерывная или
ординальная
Независимые переменные
Тест
Типы вопросов
меняется ли изучаемый признак, в зависимости от
множественные категории по односторонний повторяющийся ANOVA моментов сбора данных (вовлеченность команды в разные
времени
(анализ дисперсии)
моменты времени)
непрерывная одна
Корреляция Пирсона
проверить есть ли связь между признаками
предсказать изменение одного признака при изменении
непрерывная одна
Простая линейная регрессия
другого
множественные категории по
времени в комбинации с
другими категориальными
повторяющийся ANOVA
переменными
(генерализованная модель)
исследует, меняются ли сравниваемые группы во времени
две и более непрерывные
предсказать изменение одного признака при изменения
переменные
множественная линейная регрессия
набора других признаков
две и более непрерывные
переменные и
предсказать изменение одного признака при изменения
категориальные переменные множественная нелинейная регрессия набора других признаков: проблема робастности
ДЕСКРИПТИВНАЯ АНАЛИТИКА ДЛЯ НЕПРЕРЫВНЫХ
ДАННЫХ
Меры центральной тенденции
•
•
•
•
Изменчивость
•
•
•
•
•
•
•
•
Среднее
Медиана
Мода
Дисперсия
Стандартное отклонение
Стандартная ошибка
Размах
Отклонения формы
распределения
Асимметрия (Skewness)
Эксцесс (kurnosis)
Задачка:
Посчитайте ассиметрию и эксцесс непрерывной переменной возраст в
файле «Данные для дескрипривной аналитики», определите, можем ли
мы считать, что распределение переменной нормальное.
КОРРЕЛЯЦИИ
•
(Строгая) положительная
(positive)
•
(Строгая) отрицательная
(negative)
•
Нулевая (отсутствие, zero)
•
Нелинейная корреляция
КОРРЕЛЯЦИИ И КРОСС-ТАБЫ
Переменная X
Интервальная или
отношений
Ранговая, интервальная
или отношений
Ранговая
Дихотомическая
Дихотомическая
Дихотомическая
Переменная Y
Интервальная или отношений
Тест
Коэффициент Пирсона
Ранговая, интервальная или
отношений
Ранговая
Дихотомическая
Ранговая
Интервальная или отношений
Коэффициент Спирмена
Коэффициент Кендалла
Коэффициент φ,
Рангово-бисериальныйкоэффициент
Бисериальный коэффициент
Кросс-табы – для категориальных переменных
Тест 𝜒𝜒 2 − сравнивает частоты, которые наблюдаем в определенных условиях и частоты, которые
можно было бы наблюдать, если бы между событиями не было бы связи: должно быть не менее 5
событий, малые события корректируют, объединяя в группы (Yates' correction).
ТЕСТ 𝜒𝜒
2
𝜒𝜒 =
2
Расчетное значение:
2
наблюдаемое
значение
−ожидаемое
значение
𝑖𝑖
𝑖𝑖
𝑛𝑛
∑𝑖𝑖=1
, 𝑛𝑛
ожидаемое значение𝑖𝑖
= кол − во категорий
2
Количество степеней свободы для таблицы 𝜒𝜒 :
𝒓𝒓 − 𝟏𝟏 ∗ 𝒄𝒄 − 𝟏𝟏 , 𝒓𝒓 − кол − во строк, с
− кол − во столбцов
Как посчитать ожидаемое значение?
ENJOY YOUR STUDYING TIME
• https://www.hse.ru/staff/mondrus
THANK YOU
17