Hadoop YARN - краткое описание
Основной идеей YARN-a является разделение обязанностей менеджера ресурсов(resource management) кластера Hadoop, планировщика и системы мониторинга задач(job scheduling/monitoring) в отдельные службы(демоны). Суть идеи в том, чтоб иметь глобального менеджера ресурсов (ResourceManager - RM) и отдельного планировщика(ApplicationMaster - AM) для каждого приложения ResourceManager распределяет ресурсы между всеми приложениями в системе. NodeManager - это служба, которая запущена на каждом сервере и ответственная за использование ресурсов (cpu, memory, disk, network) каждым контейнером, который запущен на этой ноде. Также эта служба посылает отчёты о потреблённых ресурсах к ResourceManager и Scheduler. ApplicationMaster для приложения является библиотекой, которая заботится об выделении ресурсов для job-ов от ResourceManager-а и работает с NodeManager-ми для выполнения и мониторинга этих job-oв. ResourceManager имеет 2-а основных компонента: Scheduler (планировщик) и App...