[#1] ETTO 원칙으로 다시 읽는 안전관리 – overview

SAFETY MANAGEMENT · OVERVIEW

ETTO 원칙으로 다시 읽는 안전관리

왜 “잘 운영되던 시스템”이 어느 날 실패하는가, 그리고 현장에서 무엇을 먼저 바꿔야 하는가

ETTO 원칙(Efficiency-Thoroughness Trade-Off)은 Erik Hollnagel이 2009년 제시한 안전관리 프레임워크로, 현장의 의사결정을 언제나 효율성과 철저성 사이의 균형 문제로 바라본다. 이 글은 ETTO 원칙을 바탕으로, 안전관리의 관점을 개인 실수 중심 모델에서 운영 설계 중심 모델로 전환해 보려는 시도다. 핵심 질문은 단순하다. 사고는 왜 비정상 상태에서만 발생하지 않는가? 더 정확히는, 정상 운영을 가능하게 하던 조정이 왜 특정 시점에서 위험으로 전환되는가?

ETTO 원칙(Efficiency-Thoroughness Trade-Off) 안전관리 시스템 설계 – 효율성과 철저성의 균형
ETTO 원칙: 효율성과 철저성의 트레이드오프

1) ETTO 원칙이 안전관리에 필요한 이유: “원인 찾기”를 넘어 “조건 설계”로

많은 조직은 사고가 발생하면 즉시 원인을 하나로 압축하려 한다. 흔히 “누가 규정을 어겼는가”, “어떤 실수가 있었는가”, “어떤 절차를 놓쳤는가”로 결론을 내린다. 이 접근은 빠르고 명확해 보이지만, 실제로는 같은 유형의 문제를 반복시키기 쉽다. 왜냐하면 현장의 실패는 대개 단일 요인이 아니라 제약 조건 속에서 누적된 합리적 조정의 결과로 나타나기 때문이다.

ETTO 관점은 여기서 출발한다. 사람과 조직은 언제나 시간·인력·정보·예산·성과요구의 한계를 안고 일한다. 이런 환경에서 모든 과업을 완전하게 수행하는 것은 불가능하다. 결국 현실의 운영은 “충분히 빠르게”와 “충분히 정확하게” 사이에서 절충을 반복한다. 문제는 절충 자체가 아니라, 어떤 조건에서 절충의 방향이 체계적으로 기울어지는가다. 즉, “왜 이번엔 철저성보다 효율성이 우선되었는가”를 묻지 않으면 재발을 막기 어렵다.

안전관리의 품질은 ‘실패 이후의 해석’보다 ‘실패 이전의 설계’에서 갈린다. ETTO는 사고분석 프레임을 바꾼다. 누군가를 비난하기 전에, 어떤 KPI가 현장을 서두르게 만들었는지, 어떤 승인 구조가 우회를 유도했는지, 어떤 업무 분장이 점검 공백을 만들었는지, 어떤 일정 압박이 예외를 상시화했는지를 묻는다. 이 질문들이 확보되지 않으면, 조직은 사고를 줄이는 대신 보고서만 늘리게 된다.

2) ETTO의 핵심: 효율성과 철저성은 모두 필요하지만, 동시에 극대화할 수 없다

ETTO(Efficiency-Thoroughness Trade-Off)는 이름 그대로 트레이드오프 원리다. 운영 현장에서 효율성은 처리량, 속도, 비용 절감, 리드타임 단축으로 측정되는 경우가 많고, 철저성은 검증 깊이, 이중 확인, 예외 관리, 문서화 품질, 안전 여유도 등으로 나타난다. 두 축은 모두 조직 생존에 필요하지만, 자원이 한정된 실제 환경에서는 둘을 동시에 최대로 끌어올리기 어렵다.

그래서 조직은 암묵적 규칙을 만든다. “급하면 일단 진행하고 사후 보완”, “문제 없었던 방식이니 이번에도 동일 적용”, “데드라인 우선, 검토는 최소화” 같은 관행이 그 예다. 이 관행은 평소에는 높은 성과를 만든다. 하지만 복잡성 증가, 인터페이스 변경, 협업 단절, 정보 지연 같은 변화가 겹치면 취약점이 빠르게 드러난다. 즉, 실패는 돌발적이라기보다 평소의 성공 로직이 다른 조건에서 작동한 결과다.

이 점이 중요하다. ETTO는 “효율성은 나쁘고 철저성은 좋다”라고 말하지 않는다. 오히려 효율성은 운영을 지속시키는 필수 조건이며, 철저성은 운영을 안전하게 만드는 필수 조건이다. 핵심은 도덕 판단이 아니라 상황 적합성이다. 어떤 조건에서 어느 축을 얼마나 우선할지, 누가 어떤 권한으로 조정할지, 그리고 조정의 결과를 어떤 지표로 감시할지를 설계해야 한다.

3) 정상성과 실패는 분리된 세계가 아니다: “잘 되던 방식”의 역전

많은 안전체계는 정상 상태와 사고 상태를 별개의 범주로 구분한다. 하지만 ETTO는 둘 사이에 연속성이 있다고 본다. 같은 팀, 같은 절차, 같은 도구가 어떤 날은 성과를 만들고, 다른 날은 실패를 만들 수 있다. 차이를 만드는 것은 개인의 도덕성이 아니라 운영 조건의 미세한 변화와 누적된 변동성이다.

예를 들어, 평소 10분이면 끝나던 사전 점검이 일정 압박으로 4분으로 줄었다고 하자. 처음 몇 번은 문제가 없을 수 있다. 오히려 “더 효율적인 방식”으로 칭찬받을 수도 있다. 그러나 업무 난도가 올라가고 외부 변수(교대 인수인계 누락, 장비 편차, 인터페이스 업데이트)가 겹치면 축약된 점검 방식은 갑자기 위험해진다. 이때 사고의 표면 원인은 마지막 단계의 실수로 보이지만, 실제로는 여러 차례 누적된 ETTO 조정의 총합일 수 있다.

따라서 안전관리는 “사고가 난 날의 사람”만 보지 말고, “사고가 없던 날에도 반복되던 조정 패턴”을 함께 봐야 한다. ETTO는 바로 이 관점을 제공한다. 실패 분석을 이벤트 중심에서 운영 패턴 중심으로 옮겨, 사고 이전의 약한 신호를 조기에 포착하게 한다.

4) 개인 비난 모델의 한계: 왜 재발은 멈추지 않는가

사고 조사에서 개인의 선택은 물론 중요하다. 그러나 개인 책임만 강조하면 조직은 두 가지 함정에 빠진다. 첫째, 구조적 원인을 놓친다. 둘째, 보고 문화를 악화시킨다. 현장은 처벌을 피하기 위해 변동성을 숨기고, near miss를 “없던 일”로 넘기며, 관리자에게는 점점 더 깨끗한 숫자만 올라간다. 결과적으로 조직은 가장 필요한 데이터를 잃는다.

ETTO 관점에서는 질문이 바뀐다. “누가 잘못했나?”에서 “그 선택이 합리적으로 보이도록 만든 운영 조건은 무엇인가?”로 이동한다. 이 질문 전환은 책임을 지우지 않기 위한 것이 아니라, 책임의 단위를 개인에서 시스템까지 확장하기 위한 것이다. 시스템을 건드리지 않으면 같은 압력, 같은 우회, 같은 누락이 반복된다.

실무적으로는 사고 보고서의 양식을 바꿔야 한다. 단일 원인 결론 대신, 시간 압박, 정보 접근성, 승인 리드타임, 절차 가독성, 숙련도 분포, 인터페이스 혼선 등 맥락 항목을 구조화해 기록해야 한다. 이 데이터가 쌓여야 ETTO 편향의 반복 구간을 찾고, 실제로 위험을 줄이는 개선안을 설계할 수 있다.

5) Sharp End와 Blunt End: 현장의 선택은 관리층의 설계가 만든다

ETTO는 현장(Sharp End)과 관리층(Blunt End)을 분리해서 보지 않는다. 작업자는 현장에서 즉시 판단하지만, 그 판단의 방향은 상위 체계가 결정한다. KPI가 처리량만 보상하면 철저성은 비용으로 인식되고, 감사 체계가 문서 형식만 평가하면 실제 점검 품질은 사각지대가 된다.

반대로 철저성만 과도하게 강조하면서 시간·인력·도구를 제공하지 않으면, 현장은 공식 절차와 실제 작업을 분리한다. 문서는 완전하지만 운영은 우회로 채워지는 상태가 된다. 겉보기에 안정적이지만, 이런 체계는 충격(변경·장애·인수인계 실패)에 매우 취약하다.

그래서 ETTO 기반 안전관리는 “현장 교육 강화”만으로 끝나지 않는다. 성과지표, 승인 구조, 자원 배치, 교대 체계, 예외 처리 규칙, 피드백 루프까지 한 묶음으로 조정해야 한다. 현장의 행동을 바꾸고 싶다면, 현장이 그 행동을 선택하도록 만드는 조건을 먼저 바꿔야 한다.

6) 변동성 관리가 곧 안전관리다: 사고 지표만으로는 늦다

전통적 안전지표는 보통 사고 건수, 재해율, 손실 규모처럼 사후 지표에 집중한다. 물론 필요하지만, 이 지표들은 느리고 둔감하다. 사고는 희귀 사건이기 때문에 “숫자가 좋아 보이는 기간”이 꼭 안전을 의미하지 않는다. ETTO 관점에서는 사고 이전에 이미 나타나는 운영 변동성을 함께 봐야 한다.

예를 들어 다음 항목은 강력한 선행 신호가 될 수 있다.

  • Near miss 보고 빈도와 처리 리드타임
  • 예외 승인 요청의 증가 추세와 승인 속도
  • 사전 점검 체크리스트의 누락/축약 패턴
  • 재작업률, 긴급 변경 비율, 교대 인수인계 누락률
  • 교육 이수율이 아니라 현장 준수율(관찰 기반)

이런 데이터는 “사고가 난 뒤 무엇이 잘못됐는지”보다, “사고가 나기 전 어떤 균형이 이미 기울고 있는지”를 보여준다. 결국 ETTO 기반 안전관리는 리스크를 제거하는 작업이 아니라, 기울기를 조기에 감지하고 복원하는 운영 능력을 키우는 작업이다.

7) Overview 결론: 안전은 규정의 문장이 아니라 의사결정의 품질이다

ETTO의 가장 큰 기여는 안전을 도덕 문제로만 보지 않게 만든다는 점이다. 사람은 원래 불완전해서 위험한 것이 아니라, 불완전한 조건 속에서 시스템을 움직이기 위해 끊임없이 조정하기 때문에 동시에 가장 큰 위험요인이자 가장 큰 회복 자원이 된다.

따라서 좋은 안전관리의 질문은 다음과 같다. “규정을 더 엄격히 만들까?” 이전에, “현장이 철저성을 선택할 수 있게 시간을 주고 있는가?”, “KPI가 위험한 효율 쏠림을 보상하고 있지는 않은가?”, “예외가 예외로 관리되고 있는가, 상시 운영이 되었는가?”를 먼저 점검해야 한다.

이 Overview의 목적은 ETTO를 소개하는 데 그치지 않는다. 이후 본문 섹션에서는 ETTO 개념 구조, 사례 해석, 현장 적용 프레임을 단계적으로 다룰 예정이다. 특히 실무자가 바로 사용할 수 있도록, 지표 설계(Leading/Lagging), 승인 규칙, 점검 루프, 리더십 개입 포인트를 템플릿 형태로 정리할 계획이다.

요약하면, 안전은 “사고가 없었던 결과”가 아니라 매일 반복되는 의사결정의 설계 품질이다. ETTO는 그 품질을 측정하고 개선하기 위한 현실적 프레임이며, 조직이 효율성과 철저성의 균형을 의도적으로 관리하도록 만드는 출발점이다.

Source: Erik Hollnagel, The ETTO Principle: Efficiency-Thoroughness Trade-Off (2009)
error: Content is protected !!