[제조업에서의 빅데이터 활용과 사례연구 ]
1. 제조업에서의 빅데이터
제조업 특징과 빅데이터 특징
제조업은 생산효율을 높이기 위해, 방대하고 다양한 데이터를 확보해야 합니다. 또한 모니터링 장비를 통해 실시간 데이터를 빠르게 수집해야 합니다. 이는 빅데이터의 특징 3V, 즉 Volume(규모), Variety(다양성), Velocity(속도)라는 특징을 가장 잘 담고 있다고 할 수 있습니다. 이처럼 빅데이터 특징을 가장 잘 담고 있기 때문에 제조업에서의 빅데이터 활용은 활발하게 이루어지고 있습니다. 제조업의 특성을 앞서 간략히 살펴보았는데요. 각 특성에 대해서 자세히 알아보겠습니다.
제조업의 특성 중 데이터의 방대한 양을 추구하는 측면에서 살펴보면 제조업은 다른 산업과 비교할 수 없을 정도로 상당한 데이터를 보유하고 있습니다. 2009년 미국 기업들의 데이터 보유현황을 산업별로 비교한 결과에 따르면, 가장 많은 데이터를 보유하고 있는 분야는 966페타바이트의 데이터를 보유한 단일품목제조 산업분야였습니다. 또한, 화학처리 등과 같은 제조 산업분야도 694페타바이트로 17개 비교 산업 군중 4번째로 많은 데이터를 보유하고 있었습니다.
제조업이 다른 산업보다 데이터 수집에서 더 앞설 수 있는 이유는 무엇일까요? 제조업은 설계∙생산 과정의 자동화 및 제조실행시스템을 도입하였습니다. 이를 통해 제조공정의 효율성을 높이기 위해 생성된 데이터를 분석하고, 그 결과를 활용하였기 때문에 데이터 수집에서 앞설 수 있었습니다. 또한, 많은 제조업체들이 데이터 수집을 위해 전사적 자원관리 시스템을 도입하는 등 많은 노력을 기울였고, 생산효율성을 파악하기 위해서 제조 영업데이터, 고객데이터 등을 바탕으로 제조요청일, 영업일수 등을 예측할 수 있도록 많은 데이터를 축적해왔습니다. 제조업의 특성 중 데이터의 다양화를 추구하는 측면에서 살펴보겠습니다. 데이터의 다양화에서 제조업은 다른 사업에 비해 우위에 있습니다. 제조업의 경우 제조공정, 물류, 판매, 사후관리 등의 수많은 과정에서 다양한 데이터들이 발생하게 됩니다. 이러한 데이터들을 각 과정에 맞게 사용할 수도 있지만, 이를 복합적으로 분석하고 결합하여 또 다른 새로운 정보를 파악할 수도 있게 됩니다. 제조업의 특성 중 빠른 데이터 수집 측면에서 살펴보겠습니다. 제조기업은 공정 및 물류상황 등을 실시간으로 모니터링 할 수 있는 장비들을 운영 개선하여 실시간으로 데이터를 수집 및 분석할 수 있는 시스템을 구축하였습니다. 이를 통해 과거에 비해 상당히 빠른 속도로 데이터를 수집할 수 있게 되어 활용이 용이해지고 활용도도 높아졌습니다.
제조장비 데이터
빅데이터 3V 특징을 잘 담고있는 제조업에서는 과연 어떻게 빅데이터를 적용하고 있을까요? 바로 제조 장비 데이터에 빅데이터 분석을 적용하고 있습니다. 제조 장비 데이터 란 제조 장비에서 발생하는 장비 로그 데이터와 같이 생산과정에서 발생하는 데이터입니다. 이 데이터는 제조 장비 자체에서 발생하기도 하고, 장비에 센서를 부착하여 수집하기도 합니다. 센서를 통해 얻어지는 데이터는 보통 주변의 환경이나 상황, 날씨 등 다양한 유형으로 존재합니다. 이렇게 수집된 제조 장비 데이터는 빅데이터 분석에 활용함으로써 생산의 효율성 향상, 생산의 비용 절감, 장비의 기능 향상 등 다양한 효과를 창출하고 있습니다. 제조 장비 데이터는 여타 데이터들에 비교적 규칙성을 가진 데이터입니다. 따라서 SNS 분석과 같은 분야보다 상대적으로 노력은 적게 드는 반면에 정확하고 객관적인 정보 추출이 가능합니다. 이런 특징을 가진 데이터를 정형화 데이터라고 합니다. 제조업은 제조 장비 데이터 외에 수요와 공급 관련 기업 내 데이터들을 통합한 통합 운영 데이터에도 빅데이터 분석을 적용하고 있습니다.
통합 운영 데이터
새로운 가치를 창출하기 위해 기존 제조 데이터와 제조 운영에 간접적인 영향을 미치는 세일즈, 마케팅, 물류 등 기업 내∙외부의 다양한 데이터들을 통합시킨 것입니다.
2. 사례 : 마이크론 테크놀로지
마이크론 테크놀로지는 세계적인 반도체 기업입니다. 이 기업은 제조 장비 빅데이터를 이용해 수백억 원대의 비용절감 효과를 거둔 사례가 있다고 합니다.
먼저 반도체 생산 공정을 알아보겠습니다. 마이크론 테크놀로지의 반도체 생산공정은 복잡한데요. 25개의 웨이퍼가 담겨진 ‘랏’이 장비의 ‘로드포트’로 이송되면 ‘클러스터 로봇1’은 랏에 담긴 웨이퍼를 순차적으로 하나씩 꺼내어 ‘에어락’에 집어넣습니다. 에어락으로 이동된 웨이퍼는 다시 ‘클러스터 로봇2’에 의해 클러스터 챔버로 이송되어 작업됩니다. 장비에서 실제적인 작업이 이뤄지는 곳이 바로 클러스터 챔버인 것입니다. 이 챔버에서는 화학적 물질이 웨이퍼에 증착되거나 열처리가 이뤄지는 등 다양한 작업이 진행됩니다. 일반적으로 이러한 챔버 장비는 한 챔버에 하나의 웨이퍼가 할당돼 작업을 하는데 장비에 따라서 웨이퍼가 각각의 프로세스 챔버를 순차적으로 이동하며 작업이 이뤄지는 경우도 있고 각 장비 내 클러스터 챔버들이 동일한 프로세스로 이뤄져 여러 클러스터 챔버 중 하나의 챔버에서만 프로세스되는 경우도 있습니다. 프로세스를 마친 웨이퍼는 다시 에어락을 거쳐 로드포트으로 이동하고 25개 웨이퍼가 모두 작업을 마쳐 랏으로 되돌아오면 랏은 다시 다른 장비로 이송됩니다. 반도체 생산 공정을 알아보았는데요. 반도체 웨이퍼 프로세스의 경우 한 장비에서 다양한 작업이 이뤄지고 작업의 시간도 제품의 종류나 요구사항마다 다릅니다. 마이크론 테크놀로지는 이렇게 다양한 제품을 처리하는 과정에서 생성된 장비 데이터를 분석해 부품을 어떤 순서로 유입하는가에 따라 생산 시간이 불규칙하게 변화하는 것을 파악했습니다. 그리하여 처리시간을 최소화할 수 있는 부품 유입 순서를 조합해 최적화된 생산 공정을 도출해낼 수 있었습니다.
데이터 분석 방법
마이크론 테크놀로지는 데이터를 분석할 때 전형적인 비정형 데이터 분석방법을 응용했습니다. 비정형 데이터 분석방법이란 텍스트로 구성된 반도체 장비에서 발생하는 로그 데이터를 분석해서 패턴을 찾는 방법으로 실시간으로 분석하는 것이 포인트입니다. 기존처럼 단지 기계고장이 있거나 문제가 발생된 후에 분석하지 않고, 실시간으로 장비가 효율적으로 작업을 진행하고 있는지 분석하는 것입니다. 이처럼 실시간으로 의사결정을 지원하기 위해 마이크론 테크놀로지는 애널리틱스 방식을 사용하였습니다. 애널리틱스는 의미 있는 데이터 포인트를 실시간으로 파악해 정형화한 다음 이를 수학적 알고리즘을 통해 실시간으로 의사결정을 지원하는 방식입니다.
로그 분석 방법
반도체 장비에서 발생한 로그 데이터를 분석할 때 마이크론 테크놀로지는 프로세스 마이닝이란 방법을 사용하였습니다. 프로세스 마이닝이란 각 이벤트가 다른 이벤트와 순차적인 상관관계로 이뤄진 작업에서 작업이 일어난 시간과 형태를 로그로 분석하여 각 작업의 상관관계를 분석하는 로그 데이터 분석 방법입니다.
그럼 각 작업의 상관관계는 어떻게 분석할까요? 프로세스 마이닝은 로그의 이벤트 정보를 바탕으로 사건과 사건의 관계를 파악합니다. 그리고 그러한 사건들의 상관관계를 바탕으로 하여 작업들이 어떤 순서로 이뤄지고 있는지를 수학적 알고리즘으로 유추하는 것입니다.
마이크론 테크놀로지에서는 실제 데이터로 유추한 작업서와 Petri Net으로 파악된 이론적 최적의 작업진행순서를 비교해서 클러스터 내 웨이퍼 작업과 로봇의 움직임을 모니터링하고 이를 바탕으로 장비들의 작업을 최적화하여 생산성을 향상할 수 있는 아이디어를 도출하였습니다.
Petri Net모델 은 서로 직렬-병렬 형태의 상관관계를 가지는 여러 작업을 논리적 모델로 구현한 방식입니다. 이를 통해 장비가 최적의 상황으로 운영될 것을 이론적으로 모델링하고, 실제 로그데이터를 실시간으로 분석하였습니다. 그리고 로봇의 이상적인 움직임과 실제 움직임의 차이를 분석함으로써 작업에서 장비가 최대효율을 낼 수 있도록 하였습니다.
[금융업에서의 빅데이터 활용과 사례연구 ]
금융업에서 빅데이터를 어떻게 활용하고 있는지를 살펴 보기 위해, 먼저 국내 금융권에서 빅데이터 활용에 대한 동향을 파악하고, 카드 회사와 보험사, 은행 각 분야에서의 사례를 알아보겠습니다. 그리고 지능정보연구에서 발간한 다중모델을 이용한 자동차 보험 고객의 이탈예측에 대한 연구 논문을 통해 국내 자동차 보험사의 빅데이터 분석 사례를 살펴보겠습니다.
1. 금융산업에서의 빅데이터
많은 금융업체가 빅데이터 기술을 소비자 대출과 보험, 금융사기 방지 등 다양한 분야에서 활용하고 있습니다. 국내 금융권 가운데 카드, 보험사는 이미 신규 고객 개발, 마케팅 활용, 보험사기 방지 등 위험관리에 빅데이터를 적극 활용하고 있습니다. 국내 은행과 증권사들도 개인정보 보호와 IT보안 강화로 빅데이터 활용을 주저하다가 마케팅 분야에서 시범적으로 빅데이터 기술을 도입해 활용하기 시작했습니다.
기존 카드회사 들은 마케팅 목적에 맞추어서 고객을 발굴해 왔습니다. 하지만 최근에는 고객의 요구에 만족하는 ‘맞춤 마케팅’을 수행합니다. 맞춤 마케팅은 고객과 업종별 전체 결제정보에 기반을 둔 이용규모 변화, 카드사용, 패턴 등을 다양하게 담고 있는 빅데이터를 이용합니다. 이 빅데이터 자료를 바탕으로 매출정보에 대한 트렌드를 파악한 후 개인별 단기 이용성향 패턴을 찾아내어 수행하는 것입니다.
보험사 에서도 빅데이터를 활용하고 있는데 국내 보험사의 경우 빅데이터를 이용하여 보험사기방지에 주로 이용하고, 국외 보험사의 경우 보험 상품혁신, 마케팅 활용 등 국내보다 좀 더 광범위한 분야에서 사용되고 있습니다. 대표적으로 ‘UBI(Usage Based Insurance : 운전습관 맞춤 보험)자동차보험’을 들 수 있습니다.
UBI (Usage Based Insurance : 운전습관 맞춤 보험)자동차보험은 자동차 운전자의 운전습관 및 행태에 따라 보험료를 차등 적용하는 보험입니다. 미국, 영국 등 주요국에서 사용하고 있는데요. 자동차 보험의 전통적인 요율 산정 기준 외에 차량에 부착된 ‘텔레매틱스(Telematics)' 라는 장치를 통해 보험가입자의 실제 주행거리를 포함하여 주행속도, 급 코너링, 급가속, 급제동, 주행시간대, 주행도로 종류 등 전반적인 운전습관 및 행태와 관련된 데이터를 종 합적으로 모니터링하고 이에 따라 보험료율을 책정합니다.
‘ 도코모 원타임 보험 ’은 일본의 NTT도코모와 도쿄해상이 공동으로 출시한 보험입니다. 이는 휴대전화에서 수집하는 위치 정보, SNS 데이터 등을 활용하여 빅데이터를 통해 일상생활 상황에 부합하는 보험 상품을 산출하고 이를 자동 이메일 시스템을 통해 각 고객에 맞게 판매하거나 권유하는 마케팅입니다.
2. 사례 : 국내 자동차 보험사의 빅데이터 분석
2006년 지능정보연구에서 이제식 외 1명이 발표한 ‘다중모델을 이용한 자동차 보험 고객의 이탈예측에 대한 연구’ 논문에 근거하여 고객이탈 예측을 위해 국내 자동차보험사가 고객 빅데이터를 분석한 사례를 살펴보겠습니다.
국내 자동차보험사들은 금융과 보험간의 규제완화, 보험요율의 자율화, 외국 보험업체의 국내진출 등으로 인해 경쟁이 심화되었습니다. 결국 신규고객 확보에 대한 비용증가와 기업부담이 가중되었고 기존고객의 이탈문제가 보험업체의 중요한 이슈로 부각되었습니다. 이에 따라 국내 자동차 보험사들은 고객 예측모델 등을 통해 고객의 이탈방지를 위해 다양한 노력을 하고 있습니다. 고객 예측모델은 고객이탈 방지에 대한 노력을 더 효과적이고, 효율적으로 지원하는데요. 이 연구에서는 국내 자동차 보험사의 고객이탈 예측 문제를 다루고 있고, ‘보험가입 고객 중 보험만료일 시점으로부터 3개월 이내에 재가입을 하지 않은 고객’을 이탈고객으로 정의하였습니다.
그리고 예측모델을 위해 실험데이터를 구축하였습니다. 110만 건의 고객데이터로부터 30,000건을 추출하여 학습데이터(Training Data), 검증데이터(Validation Data), 평가데이터(Test Data)로 분할한 것인데요. 모델의 학습과 검증을 위해 분할하였고 고객의 성별, 연령, 보험 가입 경력, 전계약사, 차량 연식, 납입 방법, 수납 형태, 고객 직업, 보험 종목, 차종 약칭, 보험기간 내 사고여부, 대인담보 가입여부, 이탈여부 등을 포함한 46개의 속성으로 구성되었습니다.
(출처: 알리바바 빅뱅 '빅데이터에 빠진 카드사' 데일리안 2014. 12. 09)
'빅데이터분석개론' 카테고리의 다른 글
전략적 기업경영을 위한 빅데이터 분석과 사례연구 (0) | 2016.01.03 |
---|---|
의료 통신 산업과 공공부문의 빅데이터 활용과 사례연구 (0) | 2016.01.03 |
소셜 네트워크 분석의 이해 (0) | 2016.01.03 |
오피니언 마이닝의 이해 (0) | 2016.01.03 |
텍스트 마이닝의 이해 (1) | 2016.01.03 |