[제조업에서의 빅데이터 활용과 사례연구 ]


1. 제조업에서의 빅데이터


제조업 특징과 빅데이터 특징

제조업은 생산효율을 높이기 위해, 방대하고 다양한 데이터를 확보해야 합니다. 또한 모니터링 장비를 통해 실시간  데이터를 빠르게 수집해야 합니다. 이는 빅데이터의 특징 3V, 즉 Volume(규모), Variety(다양성),  Velocity(속도)라는 특징을 가장 잘 담고 있다고 할 수 있습니다. 이처럼 빅데이터 특징을 가장 잘 담고 있기  때문에 제조업에서의 빅데이터 활용은 활발하게 이루어지고 있습니다.  제조업의 특성을 앞서 간략히 살펴보았는데요. 각 특성에 대해서 자세히 알아보겠습니다.



 제조업의 특성 중 데이터의 방대한 양을 추구하는 측면에서 살펴보면 제조업은 다른 산업과 비교할 수 없을 정도로 상당한 데이터를  보유하고 있습니다. 2009년 미국 기업들의 데이터 보유현황을 산업별로 비교한 결과에 따르면, 가장 많은 데이터를  보유하고 있는 분야는 966페타바이트의 데이터를 보유한 단일품목제조 산업분야였습니다. 또한, 화학처리 등과  같은 제조 산업분야도 694페타바이트로 17개 비교 산업 군중 4번째로 많은 데이터를 보유하고 있었습니다.


제조업이 다른 산업보다 데이터 수집에서 더 앞설 수 있는 이유는 무엇일까요? 제조업은 설계∙생산 과정의 자동화  및 제조실행시스템을 도입하였습니다. 이를 통해 제조공정의 효율성을 높이기 위해 생성된 데이터를 분석하고,  그 결과를 활용하였기 때문에 데이터 수집에서 앞설 수 있었습니다. 또한, 많은 제조업체들이 데이터 수집을 위해  전사적 자원관리 시스템을 도입하는 등 많은 노력을 기울였고, 생산효율성을 파악하기 위해서 제조 영업데이터,  고객데이터 등을 바탕으로 제조요청일, 영업일수 등을 예측할 수 있도록 많은 데이터를 축적해왔습니다.  제조업의 특성 중 데이터의 다양화를 추구하는 측면에서 살펴보겠습니다.  데이터의 다양화에서 제조업은 다른  사업에 비해 우위에 있습니다. 제조업의 경우 제조공정, 물류, 판매, 사후관리 등의 수많은 과정에서 다양한  데이터들이 발생하게 됩니다. 이러한 데이터들을 각 과정에 맞게 사용할 수도 있지만, 이를 복합적으로 분석하고  결합하여 또 다른 새로운 정보를 파악할 수도 있게 됩니다.  제조업의 특성 중 빠른 데이터 수집 측면에서 살펴보겠습니다. 제조기업은 공정 및 물류상황 등을 실시간으로  모니터링 할 수 있는 장비들을 운영 개선하여 실시간으로 데이터를 수집 및 분석할 수 있는 시스템을  구축하였습니다. 이를 통해 과거에 비해 상당히 빠른 속도로 데이터를 수집할 수 있게 되어 활용이 용이해지고   활용도도 높아졌습니다.



제조장비 데이터

빅데이터 3V 특징을 잘 담고있는 제조업에서는 과연 어떻게 빅데이터를 적용하고 있을까요? 바로 제조 장비  데이터에 빅데이터 분석을 적용하고 있습니다. 제조 장비 데이터 란 제조 장비에서 발생하는 장비 로그 데이터와  같이 생산과정에서 발생하는 데이터입니다. 이 데이터는 제조 장비 자체에서 발생하기도 하고, 장비에 센서를  부착하여 수집하기도 합니다. 센서를 통해 얻어지는 데이터는 보통 주변의 환경이나 상황, 날씨 등 다양한  유형으로 존재합니다. 이렇게 수집된 제조 장비 데이터는 빅데이터 분석에 활용함으로써 생산의 효율성 향상,  생산의 비용 절감, 장비의 기능 향상 등 다양한 효과를 창출하고 있습니다. 제조 장비 데이터는 여타 데이터들에 비교적 규칙성을 가진 데이터입니다. 따라서 SNS 분석과 같은 분야보다  상대적으로 노력은 적게 드는 반면에 정확하고 객관적인 정보 추출이 가능합니다. 이런 특징을 가진 데이터를  정형화 데이터라고 합니다.  제조업은 제조 장비 데이터 외에 수요와 공급 관련 기업 내 데이터들을 통합한 통합 운영 데이터에도 빅데이터  분석을 적용하고 있습니다.  



통합 운영 데이터 

새로운 가치를 창출하기 위해 기존 제조 데이터와 제조 운영에  간접적인 영향을 미치는 세일즈, 마케팅, 물류 등 기업 내∙외부의 다양한 데이터들을 통합시킨 것입니다.





2. 사례 : 마이크론 테크놀로지




마이크론 테크놀로지는 세계적인 반도체 기업입니다. 이 기업은 제조 장비 빅데이터를 이용해 수백억 원대의  비용절감 효과를 거둔 사례가 있다고 합니다. 





먼저 반도체 생산 공정을 알아보겠습니다. 마이크론 테크놀로지의 반도체 생산공정은 복잡한데요. 25개의 웨이퍼가  담겨진 ‘랏’이 장비의 ‘로드포트’로 이송되면 ‘클러스터 로봇1’은 랏에 담긴 웨이퍼를 순차적으로 하나씩  꺼내어 ‘에어락’에 집어넣습니다. 에어락으로 이동된 웨이퍼는 다시 ‘클러스터 로봇2’에 의해 클러스터 챔버로  이송되어 작업됩니다. 장비에서 실제적인 작업이 이뤄지는 곳이 바로 클러스터 챔버인 것입니다. 이 챔버에서는  화학적 물질이 웨이퍼에 증착되거나 열처리가 이뤄지는 등 다양한 작업이 진행됩니다. 일반적으로 이러한 챔버  장비는 한 챔버에 하나의 웨이퍼가 할당돼 작업을 하는데 장비에 따라서 웨이퍼가 각각의 프로세스 챔버를  순차적으로 이동하며 작업이 이뤄지는 경우도 있고 각 장비 내 클러스터 챔버들이 동일한 프로세스로 이뤄져 여러  클러스터 챔버 중 하나의 챔버에서만 프로세스되는 경우도 있습니다. 프로세스를 마친 웨이퍼는 다시 에어락을  거쳐 로드포트으로 이동하고 25개 웨이퍼가 모두 작업을 마쳐 랏으로 되돌아오면 랏은 다시 다른 장비로  이송됩니다. 반도체 생산 공정을 알아보았는데요. 반도체 웨이퍼 프로세스의 경우 한 장비에서 다양한 작업이  이뤄지고 작업의 시간도 제품의 종류나 요구사항마다 다릅니다. 마이크론 테크놀로지는 이렇게 다양한 제품을  처리하는 과정에서 생성된 장비 데이터를 분석해 부품을 어떤 순서로 유입하는가에 따라 생산 시간이 불규칙하게  변화하는 것을 파악했습니다. 그리하여 처리시간을 최소화할 수 있는 부품 유입 순서를 조합해 최적화된 생산  공정을 도출해낼 수 있었습니다. 



데이터 분석 방법

마이크론 테크놀로지는 데이터를 분석할 때 전형적인 비정형 데이터 분석방법을 응용했습니다. 비정형 데이터  분석방법이란 텍스트로 구성된 반도체 장비에서 발생하는 로그 데이터를 분석해서 패턴을 찾는 방법으로  실시간으로 분석하는 것이 포인트입니다. 기존처럼 단지 기계고장이 있거나 문제가 발생된 후에 분석하지 않고,  실시간으로 장비가 효율적으로 작업을 진행하고 있는지 분석하는 것입니다. 이처럼 실시간으로 의사결정을  지원하기 위해 마이크론 테크놀로지는 애널리틱스 방식을 사용하였습니다. 애널리틱스는 의미 있는 데이터  포인트를 실시간으로 파악해 정형화한 다음 이를 수학적 알고리즘을 통해 실시간으로 의사결정을 지원하는  방식입니다. 



로그 분석 방법

반도체 장비에서 발생한 로그 데이터를 분석할 때 마이크론 테크놀로지는 프로세스 마이닝이란 방법을  사용하였습니다. 프로세스 마이닝이란 각 이벤트가 다른 이벤트와 순차적인 상관관계로 이뤄진 작업에서 작업이  일어난 시간과 형태를 로그로 분석하여 각 작업의 상관관계를 분석하는 로그 데이터 분석 방법입니다. 

그럼 각 작업의 상관관계는 어떻게 분석할까요? 프로세스 마이닝은 로그의 이벤트 정보를 바탕으로 사건과 사건의  관계를 파악합니다. 그리고 그러한 사건들의 상관관계를 바탕으로 하여 작업들이 어떤 순서로 이뤄지고 있는지를  수학적 알고리즘으로 유추하는 것입니다.

마이크론 테크놀로지에서는 실제 데이터로 유추한 작업서와 Petri Net으로 파악된 이론적 최적의 작업진행순서를   비교해서 클러스터 내 웨이퍼 작업과 로봇의 움직임을 모니터링하고 이를 바탕으로 장비들의 작업을 최적화하여  생산성을 향상할 수 있는 아이디어를 도출하였습니다.



Petri Net모델 은 서로 직렬-병렬 형태의 상관관계를 가지는 여러 작업을 논리적 모델로 구현한 방식입니다.  이를 통해 장비가 최적의 상황으로 운영될 것을 이론적으로 모델링하고, 실제 로그데이터를 실시간으로  분석하였습니다. 그리고 로봇의 이상적인 움직임과 실제 움직임의 차이를 분석함으로써 작업에서 장비가  최대효율을 낼 수 있도록 하였습니다.




[금융업에서의 빅데이터 활용과 사례연구 ]


금융업에서 빅데이터를  어떻게 활용하고 있는지를 살펴 보기 위해, 먼저 국내 금융권에서 빅데이터 활용에 대한 동향을 파악하고,  카드 회사와 보험사, 은행 각 분야에서의 사례를 알아보겠습니다. 그리고 지능정보연구에서 발간한 다중모델을  이용한 자동차 보험 고객의 이탈예측에 대한 연구 논문을 통해 국내 자동차 보험사의 빅데이터 분석 사례를  살펴보겠습니다.



1. 금융산업에서의 빅데이터


많은 금융업체가 빅데이터 기술을 소비자 대출과 보험, 금융사기 방지 등 다양한 분야에서 활용하고 있습니다.  국내 금융권 가운데 카드, 보험사는 이미 신규 고객 개발, 마케팅 활용, 보험사기 방지 등 위험관리에 빅데이터를  적극 활용하고 있습니다. 국내 은행과 증권사들도 개인정보 보호와 IT보안 강화로 빅데이터 활용을 주저하다가  마케팅 분야에서 시범적으로 빅데이터 기술을 도입해 활용하기 시작했습니다.


기존 카드회사 들은 마케팅 목적에 맞추어서 고객을 발굴해 왔습니다. 하지만 최근에는 고객의 요구에 만족하는  ‘맞춤 마케팅’을 수행합니다. 맞춤 마케팅은 고객과 업종별 전체 결제정보에 기반을 둔 이용규모 변화, 카드사용,  패턴 등을 다양하게 담고 있는 빅데이터를 이용합니다. 이 빅데이터 자료를 바탕으로 매출정보에 대한 트렌드를  파악한 후 개인별 단기 이용성향 패턴을 찾아내어 수행하는 것입니다. 


보험사 에서도 빅데이터를 활용하고 있는데 국내 보험사의 경우 빅데이터를 이용하여 보험사기방지에 주로 이용하고,  국외 보험사의 경우 보험 상품혁신, 마케팅 활용 등 국내보다 좀 더 광범위한 분야에서 사용되고 있습니다.  대표적으로 ‘UBI(Usage Based Insurance : 운전습관 맞춤 보험)자동차보험’을 들 수 있습니다.


UBI (Usage Based Insurance : 운전습관 맞춤 보험)자동차보험은 자동차 운전자의 운전습관 및 행태에 따라 보험료를  차등 적용하는 보험입니다. 미국, 영국 등 주요국에서 사용하고 있는데요. 자동차 보험의 전통적인 요율 산정 기준  외에 차량에 부착된 ‘텔레매틱스(Telematics)' 라는 장치를 통해 보험가입자의 실제 주행거리를 포함하여 주행속도,  급 코너링, 급가속, 급제동, 주행시간대, 주행도로 종류 등 전반적인 운전습관 및 행태와 관련된 데이터를 종 합적으로 모니터링하고 이에 따라 보험료율을 책정합니다.


도코모 원타임 보험 ’은 일본의 NTT도코모와 도쿄해상이 공동으로 출시한 보험입니다. 이는 휴대전화에서 수집하는  위치 정보, SNS 데이터 등을 활용하여 빅데이터를 통해 일상생활 상황에 부합하는 보험 상품을 산출하고 이를  자동 이메일 시스템을 통해 각 고객에 맞게 판매하거나 권유하는 마케팅입니다.


은행
은행은 개인정보보호법 등 해결해야 하는 여러 가지 문제가 남아 있어 아직은 국내보다는 해외에서 많은 빅데이터 활용사례를 확인할 수 있습니다. 국내에서는 어떻게 빅데이터를 활용하는지 몇 가지 사례를 알아볼까요? 




국내은행인 기업은행에서는 인터넷과 소셜 미디어 상에서 은행 이미지나 활동 등에 대하여 고객 감성 분석을 합니다. 이를 통해  마케팅 및 은행 평판 관리에 활용하는 방안을 수립하고 있는 정도로 빅데이터를 활용하고 있습니다. 




기타 하나은행이나 우리은행에서는 각각의 보안시스템에 기록된 로그를 대상으로 빅데이터를 분석할 계획을 가지고  있으며 이를 통해 로그 통합분석 보안성향상 프로젝트를 계획하는 단계에 있습니다.




국외은행에서는 빅데이터를 어떻게 활용했을까요? 씨티그룹의 경우 빅데이터를 활용해 대출심사 정확도를  제고했습니다. 신용도가 낮은 특정 고객을 선별한 후 대출과 신용카드 발부 여부를 결정했습니다. 이는 법인고객의  대출상환가능여부를 판단하는 정확도를 50% 이상 향상시켰습니다. 



BoA(Bank of America : 뱅크오브아메리카)의 경우, 캐시 프로 모바일 개발하였는데, 이는 자영업자를 대상으로 자금관리를 지원해주는 상품입니다. 소셜 미디어  분석을 통해 고객 성향을 파악 후 이를 상품 개발에 반영했으며 실시간 디지털 마케팅 및 리스크에 대한 조기 경보  체계에도 활용했습니다.





 2. 사례 : 국내 자동차 보험사의 빅데이터 분석


2006년 지능정보연구에서 이제식 외 1명이 발표한 ‘다중모델을 이용한 자동차 보험 고객의 이탈예측에 대한 연구’  논문에 근거하여 고객이탈 예측을 위해 국내 자동차보험사가 고객 빅데이터를 분석한 사례를 살펴보겠습니다. 


국내 자동차보험사들은 금융과 보험간의 규제완화, 보험요율의 자율화, 외국 보험업체의 국내진출 등으로 인해  경쟁이 심화되었습니다. 결국 신규고객 확보에 대한 비용증가와 기업부담이 가중되었고 기존고객의 이탈문제가  보험업체의 중요한 이슈로 부각되었습니다. 이에 따라 국내 자동차 보험사들은 고객 예측모델 등을 통해 고객의  이탈방지를 위해 다양한 노력을 하고 있습니다.  고객 예측모델은 고객이탈 방지에 대한 노력을 더 효과적이고, 효율적으로 지원하는데요. 이 연구에서는 국내  자동차 보험사의 고객이탈 예측 문제를 다루고 있고, ‘보험가입 고객 중 보험만료일 시점으로부터 3개월 이내에  재가입을 하지 않은 고객’을 이탈고객으로 정의하였습니다. 

           

그리고 예측모델을 위해 실험데이터를 구축하였습니다. 110만 건의 고객데이터로부터 30,000건을 추출하여  학습데이터(Training Data), 검증데이터(Validation Data), 평가데이터(Test Data)로 분할한 것인데요. 모델의  학습과 검증을 위해 분할하였고 고객의 성별, 연령, 보험 가입 경력, 전계약사, 차량 연식, 납입 방법, 수납 형태,  고객 직업, 보험 종목, 차종 약칭, 보험기간 내 사고여부, 대인담보 가입여부, 이탈여부 등을 포함한 46개의  속성으로 구성되었습니다. 



데이터 구축 후 분석을 위해 다중 알고리즘을 사용하는 다중 모델을 적용하였는데요. 이 연구에서는 이탈고객  예측의 정확도 향상을 위해 단일 예측 알고리즘을 사용하지 않은 것입니다. 다중모델은 판별모델, 기본모델 그리고  지원모델로 명명된 3개의 단위모델로 구성되어있습니다. 판별모델은 새로운 입력사례가 주어졌을 때, 이 사례를  기본모델과 지원모델 중 어떤 모델을 사용해서 예측하는 것이 적합한지를 결정해 주는 모델로 하나의 입력사례에  대해서, 판별모델의 판별결과에 따라 예측을 수행할 모델이 결정됩니다. 기본모델은 해당 문제영역에 있어서  대부분의 문제들을 처리하기 위한 모델로 본 연구에서는 사전에 생성한 단일모델들 중 가장 좋은 성능을 보인  모델을 기본모델로 선정하였습니다. 마지막으로 지원모델은 기본모델이 잘못 예측하는 영역에 대해 예측을  수행하는 모델로 기본모델이 예측에 실패한 사례만을 가지고 만들었습니다.



이것은 자동차보험 가입고객 이탈예측을 위한 DyMos 다중모델의 흐름도인데요. 판별모델로 C5.0 의사결정나무  모델이 사용되었고, 기본모델로 사례기반추론 모델이 사용되었으며, 지원모델로 인공신경망 모델이 사용되었습니다.  평가데이터에 의하면 단일모델의 예측성능은 사례기반추론 모델이 65.6%로 가장 높았고 인공신경망 모델이 64.5%,  C5.0 의사결정나무 모델이 63.2%인 반면, 다중모델의 적중률은 71.7%로서, 단일모델에서 가장 좋은 성능을 보여준 사 례기반추론 모델의 적중률 보다 6.1% 포인트 높았습니다. 이는 이탈고객 예측의 정확도 향상을 위해 다중 모델을  적용하는 이유를 알 수 있는 결과값입니다. 

예측을 수행할 적합한 모델을 결정하는 판별모델은 어떤 기준으로 선택하는지 알아보겠습니다. 판별모델은  학습데이터(10,000건)와 검증데이터(10,000건)를 대상으로 예측을 수행한 예측 값과 실제 값을 비교하여 예측적중  여부 속성을 생성하고, 이를 목표속성으로 하여 결정됩니다. 이 기준에 따라 DyMos 다중모델의 흐름도에서는 C5.0  의사결정나무 모델이 사용되었습니다.




● 유사사례
방대한 데이터를 저장하고 가공하는 기술이 가능해지면서 금융권의 빅데이터 활용 영토도 넓어지고 있습니다.  특히 카드사의 빅데이터 기술이 눈에 띄게 정교해지고 있는데요. 국내 금융권의 빅데이터 활용은 카드사를  중심으로 활발하게 진행되고 있습니다. 신한카드는 상품 개발단계부터 빅데이터를 활용했습니다. 빅데이터를  기초로 고객이 선호하는 혜택을 특화 서비스로 구성한 게 특징입니다. 삼성카드는 최근 빅데이터를 기반으로  회원에게 할인과 포인트 적립 등 맞춤형 혜택을 자동으로 연결해 주는 상품을 선보였고 국민카드는 고객 위치에  가까운 가맹점 혜택을 선별적으로 제공해주는 '실시간 마케팅 서비스'에 위치기반 서비스를 활용하고 있습니다.


(출처: 알리바바 빅뱅 '빅데이터에 빠진 카드사' 데일리안 2014. 12. 09)