Не могу найти достаточно ярких выражений, чтобы рассказать вам, как трудно пришлось тогда команде People Operations. Наша работа, конечно, не вопрос жизни и смерти. Но люди возмущались, кричали, даже хлопали дверью. Один из вызовов Google, с которым мы постоянно сталкиваемся, — та великая свобода, которую мы даем гуглерам, потому что обращаем внимание на факты, а гуглеры огромное значение придают справедливости и обращению с людьми. Поэтому изменения вроде тех, о которых я вам рассказываю, — поистине геркулесов труд. Каждая из команд, которые мы опрашивали, выражала недовольство существующей системой — и каждая сопротивлялась, когда предлагалось что-то новое. Только в подразделении YouTube нам высказали дюжину различных идей о том, какие новые рейтинговые системы попробовать. Я очень горжусь той спокойной настойчивостью и тщательностью, с которыми команда People Operations продиралась через чащу всех этих перемен. Не менее благодарен я и тем командам, которые работали с нами бок о бок, помогая выбросить на свалку 15 лет корпоративных традиций, чтобы освободить место новому.
Взяв за основу проведенные эксперименты, в начале 2013 г. мы отказались от квартальных рейтингов в пользу полугодичных. Многие брюзжали и ворчали, но хотя бы в нас не кидались ничем тяжелым. Зато временн ы е затраты сразу сократились наполовину.
В конце 2013 г. мы перевели более 6200 гуглеров, представляющих примерно 15% компании, на пятибалльную рейтинговую шкалу: «нуждается в улучшении», «стабильно оправдывает ожидания», «выше ожидаемого», «намного выше ожидаемого» и «великолепно». Похоже на те названия, что были раньше, но рейтинги более последовательны.
Мы действовали согласно одному из ключевых догматов медицины: Primum non nocere. Не навреди. На первом этапе изменений нашей целью было добиться такого же уровня удовлетворенности, справедливости и эффективности процесса, что и при старой рейтинговой шкале. Мы выяснили, что как только удалось преодолеть изначальный скептицизм и разъяснить новую шкалу производительности («А почему это мой балл больше не 3,8? Я точно наработал на 3,8!»), мы сэкономили время, которое раньше приходилось тратить на стенания по поводу десятой доли балла. И менеджеры вынуждены были вести более осмысленные беседы с сотрудниками, а не прятаться за высказываниями вроде «В этом квартале ваш балл вырос на 0,1. Отличная работа, продолжайте в том же духе».
И каким же облегчением было увидеть, что снижение «прецизиозности» не нанесло нам вреда. Мы провели сравнение между гуглерами, которых оценивали по 5- и 41-балльной шкалам. Задавались следующие вопросы.
Удалось ли правильно определить отстающих?
Удалось ли правильно определить кандидатов на повышение?
Носили ли обсуждения осмысленный характер?
Можно ли считать процедуру справедливой?
По общему мнению, новая процедура оказалась не хуже прежней. Может показаться, что это пиррова победа, но я лично воспринял это с огромным облегчением. Ведь ответы гуглеров, участвовавших в опросе, подтвердили то, что мы подозревали и так: 41-балльная система была лишь иллюзией точности.
Большинство гуглеров признали, что часто невозможно определить разницу в рейтингах в пределах одной десятой балла. Например, не удалось достичь консенсуса в различиях между 3,1 и 3,2. По словам сотрудницы нашей лаборатории по человеческим ресурсам и инновациям (People and Innovation Lab) Меган Хат, «возникала ситуация, когда рейтинги нельзя было считать ни надежными, ни валидными. Одному и тому же человеку с одной и той же производительностью можно было поставить как 3,2, так и 3,3, в зависимости от оценщика и группы калибровки. Это и означает ненадежность рейтинга. А если человек получает 3,3, когда на самом деле его результат не выше 3,2, то рейтинг тоже нельзя считать валидным, поскольку он не отражает реального положения дел».
Получается, рейтинги на самом деле, как говорила Меган, «группировались с ошибкой занижения или завышения». Мы должны были говорить: «Джим, твой рейтинг на уровне где-то между 3,3 и 3,5». Но на практике выходило иное. Менеджеры брали получившееся число и приписывали ему фактическое значение. Так, если кто-то показал результат между 3,3 и 3,5, менеджер мог решить, что это означает повышение производительности, хотя на самом деле человек работал на прежнем уровне. Представьте себе, насколько хуже будет, если ваш рейтинг упал, а вам говорят, что вы стали хуже работать, когда на самом деле имеет место ошибка измерений.
Читать дальше
Конец ознакомительного отрывка
Купить книгу