On-Line 공정 품질데이터 분석

왜 공정 데이터 분석의 분석이 중요한가?

공정 - 품질 데이터간의 상관성을 분석하여 불량의 원인과 개선 방법을 찾아주며,
통계적 방법으로 품질 예측 모델을 만들어서 실시간으로 품질 예측 및 감시가 가능합니다.
따라서 이상 조업을 사전에 예측하여 원인 분석/제거 및  개선을 할 수 있습니다.
또한 측정이 어려운 품질변수를 VOA (Virtual Online Analyzer) 기법을 사용하여 계산이 가능합니다.

  • 최근 수율이 크게 떨어졌는데 그 원인이 무엇일까?
  • 열교환기가 자주 막히는 데 그 원인은 무엇일까?  -- 막히기 전에 미리 알면 스케일을 없애 줄 수 있는데…
  • Downstream 처리 부서에서는 품질 불량이 우리 부서라고 주장하는 데 이를 어떻게 규명할 수 있을까?
  • 회분 반응기의 cycle time의 변동폭이 큰 데 이를 어떻게 줄일 수 있을까?
  • 품질 변수가 변하는 것을 온라인으로 감시하고 원인도 진단할 수 없을까? -- 그럼 off-spec 제품 생산량을 많이 줄일 수 있는 데…
  • 주별, 월별, 연차별 공장 관리 장표를 많은 데이터들을     압축하여 한, 두 장의 차트로 나타낼 수는 없을까? --- 그러면  공장장, 팀장, 과장, 조업자 등 각기 다른 사람들이 협조하여 공정 조업을 관리해 나가기가 쉬울 텐데
  • 센서들이 자주 고장이 나서 운전하기가 쉽지가 않네. -- 어떤 센서가 고장이 났는지 쉽게 알 수 없을까?
  • 현재 공정에서 사용하고 있는 스팀 사용량을 줄일 수 있는 방법이 없을까? -- 데이터를 분석해 보니 월간 스팀 사용량의 변동폭이 상당하던데…
  • 막대한 비용을 투자하여 컴프레서를 구입했는데  설비 수명을 최대화하면서 설비 사용을 극대화하는 방법은 없을까?
  • 운전 조건이 흔들리는데 원인이 무엇일까?  -- 어떻게 하면 안정적으로 운전할 수 있을까?

정유, 석유화학, 에너지 공장은 다양한 에너지와 유해 물질의 재순환 및 반응 공정으로 항상 유험요소를 내포하고 있으므로
안전 및 환경에 대한 관리가 더욱 중요시 되고 있습니다.

최근 공정 자동화 및 무인화 추세에 따라 DCS(Distributed Control System)가  설치되어
공정으로부터 막대한 양의 데이터들을 실시간으로 받아들일 수 있는 infrastructure가 갖추어져 있으므로
이를 이용하여 공정의 안전한 조업과 제품의 고품질을 유지하며 점진적으로 공정조업을 향상시키기 위해서는
이상이 발생한 즉시 이상 발생 여부 및 이상 원인을 진단케 해주는 실시간 감시 및 진단(On-Line Monitoring and Diagnosis) 기술이 필수적이라 할 수 있다.
여기서 제안한 통계적 모델 방법은 공정에 대한 자세한 수식적 모델을 요구하거나 전문가적 지식을 요구하지 않으면서도
공정이 통계적으로 정상상태에 있을 때의 historical database만으로도 비교적 용이하게 통계적 모델을 구축할 수 있다는 장점을 가지고 있다.
공정의 실제 거동에 대한 많은 정보를 포함하고 있는 process measurement들은  대부분 ill-conditioned,
즉 auto-correlation이 있고 각 시간에서 각 변수들끼리의 correlation이 매우 크며, 신호 대 잡음 비가 낮으므로
multivariate projection method의 하나인 PCA(Principal Component Analysis)와
거대한 하나의 공정을 계층적으로 분해하여 해석하는 Hierarchical Decomposition Procedure가 필요하게 된다.
본 연구에서는 PCA와 Hierarchical Decomposition Procedure를 이용하여 공장규모의 실시간 감시 및 진단 기술을 제안하며
이를 연속 공정인 Tennessee Eastman benchmark process에 적용하여 제안한 방법의 효율성과 정확한 진단 능력을 확인하였다.

이론

 PCA는 상호 연관성이 큰 데이터들을 상호 독립적이 되도록 정의한 새로운 measurement space내의 점들로 나타냄으로써
ill-conditioned되어 있는 방대한 양의 데이터들로부터 핵심적인 정보를 추출할 수 있는 통계 기법의 하나로서,
measurement data matrix를 PC model로 구성하면 다음과 같이 원래 변수들 보다 작은 k개의 새로운 PC들의 합으로서 표현된다.

X = t1T p1 +t2T p2 + . . . . . +tkT pk + E

 대단위 화학공장의 경우 공장규모에서 공정을 감시하고 이상이 발생 했을 때
그 원인을 보다 정확히 진단키 위해서는 수많은 변수들이 상호 연관되어 있는 거대한 복합 공정을 계층적으로 분해하여
몇 개의 하위 단위 블럭으로 나누어 주는 것이 필요하게 된다.
보통 이러한 계층적 분해 과정은 전체 공정 내에서 발생하는 여러 사건들에 대한 정보의 흐름을 끊지 않도록 하며
한 사건에 대한 정보는 오직 하나의 하위 블럭에만 나타나게 함으로써 각각의 하위 블럭들을 정보 흐름의 독립적인 공간으로 새롭게 구성하여 취급할 수 있게 된다.
따라서 계층적으로 분해한 하위 블럭들과 전체 공정에 대한 상위 블럭 상호간에는 공정에 대한 정보를 담고 있는 측정변수들을 매개로 하여 상호 보완적인 관계를 갖게 된다.

적용

위에서 제시된 방법들을 검증하기 위하여 연속공정인 Tennessee Eastman benchmark process에 적용 하였다.
이 공정은 exothermic irreversible two-phase reactor, reactor-product condenser, flash vapor-liquid separator,
reboiled product stripper, recycle compressor 다섯 개의 장치로 구성되어 있으며,
41개의 measurement variable과 12개의 manipulated variable(11 valves, reactor agitation speed)로 이루어져 있다.

우선, 실제 공정에서 일상적으로 일어나는 사건들이 포함되어 있는 정상 조업 영역의 데이터를 얻기 위해
이 공정에서 제안되어 있는 disturbance들을 공정에 가하여 PC model data를 simulation을 통하여 만들었다.
이 과정에서 각 장치들의 constraint를 벗어나거나, sensor value가 수렴하지 않고 발산하거나, product quality를 만족시키지 못하는 observation 들은 제외시켰다.
다음으로는 이렇게 구성한 model data를 가지고 전체 공정에 대한 PC model과 전체 공정을 분해한 3개의 하위 블럭 단위들 각각에 대한 PC model을 구성하였다.
여기에서 각각의 하위 블럭 단위들은 상호간에 최소한의 correlation을 갖도록 분해하는데,
이것은 특정 블럭 단위에서 발생한 이상이 다른 블럭 단위에 거의 영향을 끼치지 않거나 지연되어 나타나게 함으로써
이상이 감지된 특정 블럭 단위 내에서  이상 원인을 보다 빠르고 정확하게 진단할 수 있게 된다.
이 공정에서는 reactor, separator, stripper 세 종류의 블럭 단위로서 분해하였다.
Fig. 1.에서 알 수 있듯이 전체 공정의 PC model과 각 하위 블럭 단위의 PC model은 3-4개의 PC만으로도 그 내부의 중요한 변화들을 나타낼 수 있었다.

 한편, Validation Data는 이 공정에서 제안된 disturbance들 중에서 feed ratio, reactor cooling water inlet temperature,
condenser cooling water inlet temperature 세가지 경우에 대하여 비정상적인 크기의 이상을 발생시켜 위에서 제시한 방법들의 성능을 평가하였다.

결과 및 토론

여기에서 전체 공정의 PC model에 대한 T2, SPE chart 모두 control limit을 벗어나게 되어 초기에 이상 발생 여부를 알 수 있다.
다음으로 각각의 하위 블럭 단위들을 살펴보면 separator나 stripper 쪽에서는 disturbance의 영향이 reactor에 비해 지연되어 나타나게 되어
전체 공정의 비정상적인 조업의 원인이 반응기 블럭에 있음을 알 수 있다.
따라서 큰 공정을 몇 개의 하위 블럭 단위로 분해함으로써 공정에 일어난 이상의 원인이 되는 블럭 단위와 그렇지 않은 블럭 단위들을 구분하여 취급할 수 있어
다음의 진단 단계에서 보다 정확한 원인 규명이 가능해 진다. 
Fig. 3.에서는 control limit을 벗어난 observation에 대하여 각각의 측정변수들이 기여한 정도를 표시하는 contribution chart를 보여준다.
예상하였듯이 반응기의 온도를 나타내는 측정 변수의 기여도가 가장 큰 것으로 나타난다.
주목할 점은, 전체 공정에 대한 모델만을 구성하여 진단하는 경우에는 다른 몇 개의 변수들의 기여도도 반응기 온도에 비하면 적지만
무시할 수는 없게 되어 단독으로는 정확한 진단이 불충분하게 되나,
추가적으로 반응기 블럭 단위의 contribution chart를 이용하게 되면 반응기 온도로 정확한 진단이 됨을 알 수 있다.
또한 여기에서는 나타내지 않은 다른 두 가지 disturbance의 경우에는 전체 공정과 반응기 블럭 단위에서는 비정상적인 상태를 보여주는 반면
stripper와 separator블럭에서는 약간의 증가는 보이지만 control limit을 벗어나지는 않게 되어 이상이 발생된 특정 블럭과 원인을 추측할 수 있었다.
특히 첫번째 disturbance인 feed ratio의 경우 실제 공정의 이상이 발생된 블럭인 stripper블럭 단위에서는
정상적인 조업으로 판명된 반면에 반응기 블럭에서 이상이 감지 되었는데
이것은 다른 두 disturbance와 달리 공정의 reactant가 연결된 각 단위 장치들의 stream을 통해 전파되면서
가장 민감한 부분인 반응기 부분에서 큰 영향을 끼쳤기 때문으로 보여진다.