-
통계적 공정 관리(SPC) 를 파이썬으로 구현해 제품 품질의 시간적 변동과 개입 시점을 파악하는 방법 소개
-
pandas, plotnine, scipy를 활용해 데이터 처리·시각화·통계 계산 수행
- 일본 가고시마현 온천 데이터를 예시로, 온도·pH·황 함량을 품질 관리 지표로 분석
-
서브그룹 통계, 관리도(X-bar, S, 이동범위 차트) 를 통해 공정 안정성과 이상치 탐지
- 데이터 기반으로 공정 상태를 시각적으로 진단하고 개선 결정을 지원하는 절차 제시
파이썬을 이용한 통계적 공정 관리 개요
- 통계적 공정 관리(SPC)는 제품 품질의 변동을 측정하고 개입 시점을 판단하기 위한 통계적 접근
- 파이썬에서 plotnine을 이용해 시각화, pandas로 데이터 조작, scipy로 통계 계산 수행
- 실습에서는 온천수 품질 관리 사례를 통해 SPC 개념을 적용
- 온천의 온도, pH, 황 함량을 주요 품질 지표로 설정
패키지 및 사용자 정의 함수
- 필요한 패키지: pandas, plotnine, scipy
- 사용자 정의 함수는 GitHub 저장소의 functions/ 디렉터리에서 가져옴
-
functions_distributions.py: 신뢰도 및 분포 함수
-
functions_process_control.py: 공정 관리용 함수
-
sys.path.append('functions')로 함수 디렉터리를 파이썬 경로에 추가 후 import
사례: 일본 온천 품질 관리
- 일본 온천(onsen)은 지역 경제의 핵심 관광 자원으로, 온도·pH·황 함량이 품질 기준
- 온도 기준: Extra Hot(>42°C), Hot(41~34°C), Warm(33~25°C)
- pH 기준: Acidic(pH<3) ~ Alkaline(pH>8.5)
- 황 기준: 1mg/kg 이상일 때 황온천으로 분류
- 가고시마현 온천 데이터를 15개월간 매월 20회 샘플링하여 품질 변동 분석
데이터 불러오기 및 기초 통계
-
onsen.csv 파일을 불러와 온도, pH, 황 함량 데이터 확인
-
describe() 함수로 평균(mean)과 표준편차(sd) 계산
- 예시 결과: 평균 44.85°C, 표준편차 1.99°C
- 이 통계값은 공정의 중심과 변동성을 파악하는 기본 지표
공정 개요 시각화
-
plotnine으로 시간별 온도 분포를 상자그림(boxplot)과 점 분포로 시각화
- 중심선은 전체 평균, 각 시점별 분포를 비교 가능
- 히스토그램으로 전체 온도 분포를 표시해 공정 중심과 변동 폭 확인
서브그룹 통계 계산
- 각 시점(time)을 서브그룹으로 묶어 평균(xbar), 범위(r), 표준편차(sd) 계산
- 예시: 첫 번째 그룹 평균 44.635°C, 범위 4.2°C
-
σₛ (서브그룹 내 표준편차) 와 표준오차(se) 를 계산해 상·하한선(±3σ) 설정
- 이를 통해 공정의 시간적 안정성을 평가
전체 공정 통계
- 전체 그룹을 통합해 총평균(xbbar), 평균범위(rbar), 평균표준편차(sdbar) 계산
- 예시: xbbar 44.85, rbar 7.26, sdbar 1.94
-
σₜ (전체 표준편차) 와 비교해 공정 내·간 변동성 파악
관리도(X-bar 및 S 차트)
- X-bar 차트: 각 서브그룹 평균을 시간축에 표시
- 중심선: 전체 평균, 상·하한선: ±3σ
- 음영 영역은 관리 한계 범위
- 관리 한계선을 벗어나거나 비랜덤 패턴이 나타나면 공정 이상 가능성 존재
학습 점검: pH 공정 시각화
- 동일한 ggprocess() 함수를 이용해 pH 데이터의 공정 개요 차트 생성
이동범위 차트 (n=1)
- 개별 측정치만 있을 때는 이동범위(Moving Range) 사용
- 평균 이동범위(mrbar), 상한(upper), 하한(lower=0) 계산
- 이동범위 차트는 개별 데이터 기반 공정 변동 감시에 유용
결론
- 파이썬을 이용해 공정 개요, 서브그룹 통계, 이동범위 차트를 생성
- SPC 도구를 통해 공정의 안정성·이상 여부를 시각적으로 진단 가능
- 이러한 분석은 데이터 기반 품질 개선과 의사결정에 활용 가능