파이썬에서의 통계적 공정 관리

1 week ago 6

  • 통계적 공정 관리(SPC) 를 파이썬으로 구현해 제품 품질의 시간적 변동과 개입 시점을 파악하는 방법 소개
  • pandas, plotnine, scipy를 활용해 데이터 처리·시각화·통계 계산 수행
  • 일본 가고시마현 온천 데이터를 예시로, 온도·pH·황 함량을 품질 관리 지표로 분석
  • 서브그룹 통계, 관리도(X-bar, S, 이동범위 차트) 를 통해 공정 안정성과 이상치 탐지
  • 데이터 기반으로 공정 상태를 시각적으로 진단하고 개선 결정을 지원하는 절차 제시

파이썬을 이용한 통계적 공정 관리 개요

  • 통계적 공정 관리(SPC)는 제품 품질의 변동을 측정하고 개입 시점을 판단하기 위한 통계적 접근
    • 파이썬에서 plotnine을 이용해 시각화, pandas로 데이터 조작, scipy로 통계 계산 수행
  • 실습에서는 온천수 품질 관리 사례를 통해 SPC 개념을 적용
    • 온천의 온도, pH, 황 함량을 주요 품질 지표로 설정

패키지 및 사용자 정의 함수

  • 필요한 패키지: pandas, plotnine, scipy
  • 사용자 정의 함수는 GitHub 저장소의 functions/ 디렉터리에서 가져옴
    • functions_distributions.py: 신뢰도 및 분포 함수
    • functions_process_control.py: 공정 관리용 함수
  • sys.path.append('functions')로 함수 디렉터리를 파이썬 경로에 추가 후 import

사례: 일본 온천 품질 관리

  • 일본 온천(onsen)은 지역 경제의 핵심 관광 자원으로, 온도·pH·황 함량이 품질 기준
    • 온도 기준: Extra Hot(>42°C), Hot(41~34°C), Warm(33~25°C)
    • pH 기준: Acidic(pH<3) ~ Alkaline(pH>8.5)
    • 황 기준: 1mg/kg 이상일 때 황온천으로 분류
  • 가고시마현 온천 데이터를 15개월간 매월 20회 샘플링하여 품질 변동 분석

데이터 불러오기 및 기초 통계

  • onsen.csv 파일을 불러와 온도, pH, 황 함량 데이터 확인
  • describe() 함수로 평균(mean)과 표준편차(sd) 계산
    • 예시 결과: 평균 44.85°C, 표준편차 1.99°C
  • 이 통계값은 공정의 중심과 변동성을 파악하는 기본 지표

공정 개요 시각화

  • plotnine으로 시간별 온도 분포를 상자그림(boxplot)과 점 분포로 시각화
    • 중심선은 전체 평균, 각 시점별 분포를 비교 가능
  • 히스토그램으로 전체 온도 분포를 표시해 공정 중심과 변동 폭 확인

서브그룹 통계 계산

  • 각 시점(time)을 서브그룹으로 묶어 평균(xbar), 범위(r), 표준편차(sd) 계산
    • 예시: 첫 번째 그룹 평균 44.635°C, 범위 4.2°C
  • σₛ (서브그룹 내 표준편차)표준오차(se) 를 계산해 상·하한선(±3σ) 설정
  • 이를 통해 공정의 시간적 안정성을 평가

전체 공정 통계

  • 전체 그룹을 통합해 총평균(xbbar), 평균범위(rbar), 평균표준편차(sdbar) 계산
    • 예시: xbbar 44.85, rbar 7.26, sdbar 1.94
  • σₜ (전체 표준편차) 와 비교해 공정 내·간 변동성 파악

관리도(X-bar 및 S 차트)

  • X-bar 차트: 각 서브그룹 평균을 시간축에 표시
    • 중심선: 전체 평균, 상·하한선: ±3σ
    • 음영 영역은 관리 한계 범위
  • 관리 한계선을 벗어나거나 비랜덤 패턴이 나타나면 공정 이상 가능성 존재

학습 점검: pH 공정 시각화

  • 동일한 ggprocess() 함수를 이용해 pH 데이터의 공정 개요 차트 생성
    • 평균선과 각 시점별 분포를 시각적으로 비교

이동범위 차트 (n=1)

  • 개별 측정치만 있을 때는 이동범위(Moving Range) 사용
    • 연속 측정값 간 절대차를 계산해 변동성 추정
  • 평균 이동범위(mrbar), 상한(upper), 하한(lower=0) 계산
  • 이동범위 차트는 개별 데이터 기반 공정 변동 감시에 유용

결론

  • 파이썬을 이용해 공정 개요, 서브그룹 통계, 이동범위 차트를 생성
  • SPC 도구를 통해 공정의 안정성·이상 여부를 시각적으로 진단 가능
  • 이러한 분석은 데이터 기반 품질 개선과 의사결정에 활용 가능

Read Entire Article