Model for human capital management of an enterprise based on reinforcement learning methods

E. V. Orlova; Орлова Е. В.

doi:10.31857/S0424738825010072

Модель управления человеческим капиталом предприятия на основе методов «машинного обучения с подкреплением»

Авторы: Орлова Е.В.¹
Учреждения:
1. Уфимский университет науки и технологий
Выпуск: Том 61, № 1 (2025)
Страницы: 70-83
Раздел: Проблемы предприятий
URL: https://clinpractice.ru/0424-7388/article/view/682162
DOI: https://doi.org/10.31857/S0424738825010072
ID: 682162

Цитировать

Полный текст

Открытый доступ
Доступ закрыт

Доступ предоставлен
Доступ закрыт

Доступ платный или только для подписчиков

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

Человеческий капитал является одним из важнейших движущих сил устойчивого экономического роста предприятия, что приобретает еще большую значимость в условиях изменений характера труда в период цифровой трансформации экономики. Портрет работника становится все более многогранным вследствие расширения сфер его активности. Поэтому проблема управления человеческим капиталом на основе формирования индивидуальных траекторий профессионального развития работников представляется актуальной, своевременной, социально и экономически значимой. В работе предлагается модель управления человеческим капиталом, предназначенная для разработки индивидуальных траекторий профессионального развития работников предприятия, формирование которых основано на методах машинного обучения — «машинного обучения с подкреплением». Модель формирует оптимальный режим управления и рассматривается как последовательный набор программных мероприятий, направленных на развитие работника в профессиональной сфере с учетом его изменяющихся в динамике индивидуальных характеристик состояния здоровья, уровня профессиональных и надпрофессиональных компетенций, мотивации, социального капитала. Архитектуру системы управления можно рассматривать как цифровой двойник работника предприятия, который объединяет среду — модель работника как марковского процесса принятия решений и модель управления — агента — центра принятия решений предприятия. Для максимизации функции полезности агента используются алгоритмы «машинного обучения с подкреплением» DQN, DDQN, SARSA, PRO. На основе проведенных экспериментов показано, что наилучшие результаты в смысле достижения максимальной полезности агента обеспечивает алгоритм DDQN. Практическую значимость имеют результаты, сгенерированные предлагаемой моделью, реализация которых позволит в кратчайшие сроки обеспечить рост инновационности и конкурентоспособности предприятия за счет улучшения качества человеческого капитала и роста ресурсной эффективности труда.

Ключевые слова

человеческий капитал, цифровой двойник работника, индивидуальные траектории, машинное обучение, «машинное обучение с подкреплением», Q-обучение, оптимальное управление, марковский процесс принятия решений

Полный текст

Об авторах

Е. В. Орлова

Уфимский университет науки и технологий

Автор, ответственный за переписку.
Email: ekorl@mail.ru
Россия, Уфа

Список литературы

Акопов А. С. (2023). Моделирование и оптимизация стратегий принятия индивидуальных решений в многоагентных социально-экономических системах с использованием машинного обучения // Бизнес-информатика. Т. 17. № 2. С. 7–19. doi: 10.17323/2587-814X.2023.2.7.19 [Akopov A. S. (2023). Modeling and optimization of strategies for making individual decisions in multi-agent socio-economic systems with the use of machine learning. Business Informatics, 17, 2, 7–19. doi: 10.17323/2587-814X.2023.2.7.19 (in Russian).]
Боровков А. И. (2021) Цифровые двойники в условиях четвертой промышленной революции // CONNECT. Мир информационных технологий. № 1–2. С. 50–53. [Borovkov A. I. (2021). Digital twins in the fourth industrial revolution. CONNECT. The World of Information Technologies, 1–2, 50–53 (in Russian).]
Макаров В. Л., Бахтизин А. Р., Бекларян Г. Л. (2019). Разработка цифровых двойников для производственных предприятий // Бизнес-информатика. Т. 13. № 4. С. 7–16. doi: 10.17323/1998-0663.2019.4.7.16 [Makarov V. L., Bakhtizin A. R., Beklaryan G. L. (2019). Developing digital twins for production enterprises. Business Informatics, 13, 4, 7–16. doi: 10.17323/1998-0663.2019.4.7.16 (in Russian).]
Макаров В. Л., Бахтизин А. Р., Бекларян Г. Л., Акопов А. С., Ровенская Е. А., Стрелковский Н. В. (2022). Агентное моделирование социально-экономических последствий миграции при государственном регулировании занятости // Экономика и математические методы. Т. 58. № 1. С. 113–130. doi: 10.31857/S042473880018960-5 [Makarov V. L., Bakhtizin A. R., Beklaryan G. L., Akopov A. S., Rovenskaya E. A., Strelkovsky N. V. (2022). Agent-based modeling of the socio-economic consequences of migration under state regulation of employment. Economics and Mathematical Methods, 58, 1, 113–130. doi: 10.31857/S042473880018960-5 (in Russian).]
Макаров В. Л., Бахтизин А. Р., Бекларян Г. Л., Акопов А. С., Стрелковский Н. В., Ровенская Е. А. (2020). Агентное моделирование популяционной динамики двух взаимодействующих сообществ: мигрантов и коренных жителей // Экономика и математические методы. Т. 56. № 2. С. 5–19. doi: 10.31857/S042473880009217-7 [Makarov V. L., Bakhtizin A. R., Beklaryan G. L., Akopov A. S., Strelkovsky N. V., Rovenskaya E. A. (2020). Agent-based modeling of population dynamics of two interacting communities: Migrants and indigenous residents. Economics and Mathematical Methods, 56, 2, 5–19. doi: 10.31857/S042473880009217-7 (in Russian).]
Макаров В. Л., Клейнер Г. Б. (2007). Микроэкономика знаний. М.: Экономика. 300 с. [Makarov V. L., Kleiner G. B. (2007). Microeconomics of knowledge. Moscow: Economics. 300 p. (in Russian).]
Орлова Е. В. (2020а). Методы и модели анализа данных и машинного обучения в задаче управления производительностью труда // Программная инженерия. № 4. С. 219–229. doi: 10.17587/prin.11.219-229 [Orlova E. V. (2020а). Methods and models of data analysis and machine learning in the problem of labor productivity management. Programmnaya Ingeneria (Software Engineering), 11, 4, 219–229. doi: 10.17587/prin.11.219-229 (in Russian).]
Орлова Е. В. (2020б). Управление производительностью труда с учетом факторов здоровья: технология и модели // Управленец. № 6. С. 57–69. doi: 10.29141/2218-5003-2020-11-6-5 [Orlova E. V. (2020b). Labour productivity management using health factors: Technique and models. The Manager (Upravlenets), 11, 6, 57–69. doi: 10.29141/2218-5003-2020-11-6-5 (in Russian).]
Орлова Е. В. (2021). Оценка человеческого капитала предприятия и управление им в условиях цифровой трансформации экономики // Journal of Applied Economic Research. Т. 20. № 4. С. 666–700. doi: 10.15826/vestnik.2021.20.4.026 [Orlova E. V. (2021). Assessment of the human capital of an enterprise and its management in the context of the digital transformation of the economy. Journal of Applied Economic Research, 20, 4, 666–700. doi: 10.15826/vestnik.2021.20.4.026 (in Russian).]
Пономарев Е. С., Оселедец И. В., Чихоцкий А. С. (2019). Использование обучения с подкреплением в задаче алгоритмической торговли // Информационные процессы. Т. 19. № 2. C. 122–131. [Ponomarev E. S., Oseledets I. V., Chihotsky A. S. (2019). Using reinforcement learning in algorithmic trading. Information Processes, 19, 2, 122–131 (in Russian).]
Abideen A. Z., Sundram V. P.K., Pyeman J., Othman A. K., Sorooshian S. (2021). Digital twin integrated reinforced learning in supply chain and logistics. Logistics, 5, 84. doi: 10.3390/logistics5040084
Alzyoud A. (2018). The influence of human resource management practices on employee work engagement. Foundations of Management, 10, 251–256. doi: 10.2478/fman-2018-0019
Azhikodan A. R., Bhat A. G., Jadhav M. V. (2019). Stock trading bot using deep reinforcement learning. In: Innovations in computer science and engineering. Springer: Berlin/Heidelberg, Germany, 41–49.
Chi M., VanLehn K., Litman D. et al. (2011). Empirically evaluating the application of reinforcement learning to the induction of effective and adaptive pedagogical strategies. User Model User-Adapted Interaction, 21, 137–180. doi: 10.1007/s11257-010-9093-1
Church A. H., Bracken D. W., Fleeno J. W., Rose D. S. (2019). Handbook of strategic 360 feedback. New York: Oxford University Press. 637 p.
Ding Q., Jahanshahi H., Wang Y., Bekiros S., Alassafi M. O. (2022). Optimal reinforcement learning-based control algorithm for a class of nonlinear macroeconomic systems. Mathematics, 10, 499. doi: 10.3390/math10030499
Granovetter M. S. (1973). The strength of weak ties. American Journal of Psychology, 78 (6), 1360–1380.
Hernaus T., Pavlovic D., Klindzic M. (2019). Organizational career management practices: The role of the relationship between HRM and trade unions. Employee Relations, 41, 84–100. doi: 10.1108/ER-02-2018-0035
Hitka M., Kucharčíková A., Štarchoň P., Balážová Ž., Lukáč M., Stacho Z. (2019). Knowledge and human capital as sustainable competitive advantage in human resource management. Sustainability, 11, 4985. doi: 10.3390/su11184985
Jung Y., Takeuchi N. (2018). A lifespan perspective for understanding career self-management and satisfaction: The role of developmental human resource practices and organizational support. Human Relations, 7, 73–102.
Li Q., Lin T., Yu Q., Du H., Li J., Fu X. (2023). Review of deep reinforcement learning and its application in modern renewable power system control. Energies, 16, 4143. doi: 10.3390/en16104143
Liu J., Zhang Y., Wang X., Deng Y., Wu X. (2019). Dynamic pricing on e-commerce platform with deep reinforcement learning. arXiv:1912.02572.
Mohammadi М., Al-Fuqaha А. Guizani М., Oh J. (2018). Semisupervised deep reinforcement leaming in support of loT and smart city services. IEEE Internet of Things Journal, 5, 2, 624–635.
Orlova E. V. (2021a). Innovation in company labor productivity management: Data science methods application. Applied System Innovation, 4, 3, 68. DOI: 10.3390/ asi4030068
Orlova E. V. (2021b). Design of personal trajectories for employees’ professional development in the knowledge society under industry 5.0. Social Sciences, 10, 11, 427. doi: 10.3390/socsci10110427
Orlova E. V. (2022). Design technology and ai-based decision making model for digital twin engineering. Future Internet, 14, 9, 248. doi: 10.3390/fi14090248
Orlova E. V. (2023). Inference of factors for labor productivity growth used randomized experiment and statistical causality. Mathematics, 11, 4, 863. doi: 10.3390/math11040863
Orr J., Dutta A. (2023). Multi-agent deep reinforcement learning for multi-robot applications: A survey. Sensors, 23, 3625. doi: 10.3390/s23073625
Osranek R., Zink K. J. (2014). Corporate human capital and social sustainability of human resources. In: I. Ehnert, W. Harry, K. Zink. Sustainability and human resource management. CSR, Sustainability, Ethics & Governance. Springer, Berlin, Heidelberg. doi: 10.1007/978-3-642-37524-8_5
Rachid В., Mohamed T., Khouaja M. A. (2018). An agent based modeling approach in the strategic human resource. Management, including endogenous and exogenous factors. Simulation Modelling Practice and Theory, 88, 32–47.
Schelling T. C. (1971). Dynamic models of segregation. The Journal of Mathematical Sociology, (Informa UK Limited), 1 (2), 143–186. doi: 10.1080/0022250x.1971.9989794
Steelman L. A., Williams J. R. (2019). Feedback at work. Switzerland AG: Springer Nature. 280 p.
Stokowski S., Li B., Goss B. D., Hutchens S., Turk M. (2018). Work motivation and job satisfaction of sport management faculty members. Sport Management Education Journal, 12, 80–89. doi: 10.1123/smej.2017-0011
Wang R., Chen Z., Xing Q., Zhang Z., Zhang T. (2022). A modified rainbow-based deep reinforcement learning method for optimal scheduling of charging station. Sustainability, 14, 1884. doi: 10.3390/su14031884
Yan Y., Chow A. H., Ho C. P., Kuo Y. H., Wu Q., Ying C. (2022). Reinforcement learning forlogistics and supply chain management: Methodologies, state of the art, and future opportunities. Transportation Research Part E: Logistics and Transportation Review, 162, 102712.
Yu C., Liu J., Nemati S. (2019a). Reinforcement learning in healthcare: A survey. arXiv:1908.08796.
Yu P., Lee J. S., Kulyatin I., Shi Z., Dasgupta S. (2019b). Model-based deep reinforcement learning for dynamic portfolio optimization. arXiv:1901.08740.
Zhang L., Guo X., Lei Z., Lim M. K. (2019). Social network analysis of sustainable human resource management from the employee training’s perspective. Sustainability, 11, 380. doi: 10.3390/su11020380
Zheng G., Zhang F., Zheng Z., Xiang Y., Yuan N. J., Xie X., Li Z. (2018). DRN: A deep reinforcement learning framework for news recommendation. In: Proceedings of the 2018 World Wide Web Conference. Lyon, France, 167–176.

Дополнительные файлы

Доп. файлы

Действие

1. JATS XML

Скачать

2. Рис. 1. Концептуальная схема технологии построения цифрового двойника работника

Скачать (49KB)

Метаданные

3. Рис. 2. Граф переходов из состояния s в состояние при реализации действия a

Скачать (21KB)

Метаданные

4. Рис. 3. Архитектура проектируемой модели управления человеческим капиталом

Скачать (31KB)

Метаданные

5. Рис. 4. Укрупненный алгоритм обучения DDQN-агента

Скачать (39KB)

Метаданные

6. Рис. 5. Представление задачи в виде сетки 5×5

Скачать (10KB)

Метаданные

7. Рис. 6. Результаты обучения агента, коэффициент дисконтирования , вероятность случайного действия : а) эксперимент 1 — обучение на основе алгоритма DQN; б) эксперимент 2 — обучение на основе алгоритма DDQN; в) эксперимент 3 — обучение на основе алгоритма SARSA; г) эксперимент 4 — обучение на основе алгоритма PRO

Скачать (52KB)

Метаданные

8. Рис. 7. Оптимальные политики (ИТР): а) эксперимент 1, начальное состояние (1, 1), целевое состояние (3, 5), возможен переход (прыжок) из состояния (4, 3) в состояние (3, 4); б) эксперимент 2, начальное состояние (2, 1), целевое состояние (4, 4), возможен переход (прыжок) из (1, 3) в (2, 4)

Скачать (13KB)

Метаданные

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Том 61, № 3 (2025)

Том 61, № 3 (2025)

Модель управления человеческим капиталом предприятия на основе методов «машинного обучения с подкреплением»

Полный текст

Аннотация

Ключевые слова

Полный текст

Об авторах

Е. В. Орлова

Список литературы

Дополнительные файлы