데이터 사이언스는 현시대에 가장 핫한 영역이다. 디지털 시대에는 데이터 자본주의라고 불리는 만큼 가치 창출 대부분이 데이터에 기반하고 있다. 이러한 환경하에 데이터 사이언스는 데이터에 대한 포괄적인 지식을 체계화하고 있는 영역이기 때문에 데이터의 생성은 매우 중요하다. DIKW 피라미드에 의하면 데이터(Data)는 정보(Information)를 만들어 내고 이들 정보는 지식(Knowledge)을 형성하며 최종적으로 의사결정을 할 수 있는 지혜(Wisdom)로 활용되어진다고 한다. 따라서 데이터가 어떤 맥락으로부터 만들어지느냐는 데이터의 활용 가치 측면에서 큰 영향을 미친다.
데이터와 관련한 ‘믹서기 이론’이 있다. 딸기 주스를 만들어 마시기 위해 딸기밭에서 딸기를 따온다고 가정해보자. 딸기밭에서 10개의 딸기를 따왔는데 9개의 딸기는 크고 싱싱한 먹음직스러운 딸기이지만 나머지 1개의 딸기는 벌레가 먹은 썩은 딸기를 따왔다고 가정을 하자. 이 10개의 딸기를 믹서기에 갈아서 딸기주스를 만들었을 때, 이 사실을 모르는 사람은 딸기주스를 마시겠지만 딸기의 상태를 알고 있는 사람이라면 누구도 그 주스를 마시려 하지 않을 것이다. 그 주스를 마실 수 있고 없고는 딸기의 문제이지 믹서기의 문제가 아니다. 그런데 실제로 현업을 보면 믹서기에 해당하는 IT시스템의 기능적인 측면에 대한 관심은 높지만 딸기에 해당하는 데이터에 대한 관심은 상대적으로 낮다. 아무리 우수한 기능을 가지고 있는 믹서기라도 썩은 딸기를 신선한 주스로 만들어 줄 수 없는 바와 같이 아무리 시스템이 좋은 성능을 갖도록 개발이 되었더라도 입력 데이터가 바르지 못하다면 이를 통해 생성되는 정보는 사실상 활용이 어렵다.
이것이 ‘믹서기 이론’이다. 딸기를 밭에서 따와서 딸기를 손질하고 문제 있는 딸기를 걸러내고 필요한 첨가물을 넣어 주스를 만들어 마시는 일련의 과정은 ‘데이터 사이언스’ 영역이라고 할 수 있다. 반면에 싱싱한 딸기를 만들어 내고 싱싱한 딸기를 채취하는 과정은 일련의 프로세스라고 할 수 있으며, 이를 체계적으로 수행하는 일련의 체계를 ‘프로세스 사이언스’라고 한다.
좋은 프로세스가 좋은 데이터를 만들어 낸다. 그리고 좋은 데이터는 비즈니스 가치를 만들어내기도 하며, 해당 프로세스에 대한 개선과 혁신으로 이어진다. 이는 더 나은 프로세스를 만들어내는 기반이 된다. 그리고 그 프로세스는 다시금 더 나은 데이터를 만들어 낸다. 결국 프로세스 사이언스와 데이터 사이언스는 상호 선순환 관계를 가지고 있다고 할 수 있다.
데이터 사이언스는 데이터의 취합, 분석, 활용 등에 대한 기술적 체계라고 한다면 프로세스 사이언스는 프로세스 분석, 프로세스 자동화, 프로세스 거버넌스 등에 대한 기술적 체계이며, 데이터 사이언스와 프로세스 사이언스는 결국은 인공지능 거버넌스 체계에 의해 연계된다고 볼 수 있다. 데이터 사이언스에 이어 프로세스 사이언스가 주목받는 시기가 머지않아 도래할 것이다.