스타트업에서 데이터로 밥값하기

작성자: Greg(Data Team Lead)|2022.07.06

데이터 시대의 스타트업, 데이터인(人)이 필요할까?

스스로 운전하는 자동차가 내가 걸어가는 도보 옆을 지나가고, 벼락같은 천벌로 여겨졌던 질병의 원인이 규명되더니 잇따라 치료제가 개발되는 등 데이터는 우리가 살아가는 세상을 빠르게 변화시키고 있습니다. 바야흐로 기업, 학교, 정부 기관 개인 등 모든 이들이 데이터를 수집하고 분석하고 탐구하는 ‘데이터의 시대’인 것이지요. 이런 사회적 흐름 속에서 기존에 존재하지 않던 창조와 혁신을 추구하는 스타트업 역시 데이터로 일하는 것, 데이터를 기반으로 의사결정 하는 것을 당연시하고 이를 추구하는 것을 쉬이 볼 수 있습니다.


하지만 스타트업에서 데이터란 참 계륵 같은 존재라는 생각이 듭니다. 정확히는 스타트업뿐만 아니라 현 위치가 목표지점보다는 출발점에 상대적으로 가까운 모든 이에게 데이터는 계륵 같은 존재라고 생각합니다. 특히 데이터를 기반으로 업무를 수행하거나 데이터인과의 협업에 대한 경험치가 낮은 스타트업일수록 데이터 기반의 업무와 데이터인의 역할은 애매해지게 되죠. “여지껏 쌓인 데이터를 전문가가 살펴보면 새로운 정보를 획득하게 될 거야”라는 동료들의 기대와, “데이터가 아무리 많아도, 잘 정제된 양질의 데이터 없이는 분석이 무슨 소용이 있을까”와 같은 데이터인의 우려가 공존하기 때문이지요. 이는 양과 질 모두 충족이 되어야 가치가 창출되는 데이터의 특성 때문인데요.


이런 데이터의 특성은 부동산에 비유해보면 다음과 같습니다. 교통, 교육, 유동인구, 주거 등이 탁월한 소위 노른자 땅에 해당하는 토지는 다방면으로 활용하여 가치를 창출할 수 있지만, 그렇지 않은 토지는 넓이와 상관없이 활용가치가 없는 경우가 종종 존재합니다. 반대로, 아무리 좋은 땅이더라도 넓이가 충분하지 않은 경우, 할 수 있는 것이 없는 것처럼 데이터도 마찬가지예요. 양과 질 모두가 일정 수준 이상 충족되지 않는 한, 데이터 기반의 의사결정 및 비즈니스에 도움이 되는 인사이트를 추출하지 못하는 것이죠.


최근 데이터 수집과 저장 단계를 수행해주는 서비스의 발달로 인하여, 스타트업들도 그리 힘들지 않게 양질의 데이터를 보유할 수 있게 되었지만, 여전히 ‘충분한 양’의 데이터를 확보하기는 어려운 상황입니다. 이는 사실 스타트업이기 때문에 겪게 되는 태생적인 한계인데요, 스타트업은 말 그대로 백지부터 시작하는 입장이기에 충분한 고객을 확보하지 못한 상태이고, 이로 인해 비즈니스 관련된 충분한 데이터를 보유하지 못합니다. 만약, PMF(Product Market Fit)을 찾아가는 단계에서 (개인적으로 PMF를 찾은 곳은 스타트업이 아니라고 생각) 데이터를 토대로 앞으로의 방향을 제시 할 수 있다면, 그리고 구성원과 이를 토대로 구성된 전략에 대한 공감대를 형성 할 수 있다면, 그 사람은 타고난 능력의 소유자라고 생각합니다. (혹은 사기꾼이거나).


그렇다면, 충분한 양과 질의 데이터를 보유하고 있지 않은 스타트업은 데이터인(데이터 분석가, 엔지니어 등)과 함께 할 필요가 없는 것일까요? 저는 데이터가 충분하지 않기에 오히려 데이터인의 필요성이 극대화된다고 생각합니다. 데이터는 쌓이면 쌓일수록 빛을 발하기도 하지만, 축적됨에 따라 기틀 다지기의 난이도 또한 상승하기 때문입니다. 따라서, 어느 정도 MVP개발이 끝나고 고객과의 접점이 증가하기 시작하면서부터는, 데이터를 축적하고 사용가능 방안을 제시할 데이터인과 함께 하는 것이 필요합니다. 다만, 끈기를 갖고 본인의 역량에 상황을 맞추는 것이 아니라, 상황에 본인의 역량을 맞추어 성장할 수 있는, 잡초같이 아무데서나 뿌리를 내리고 점차 퍼져나가는 데이터인이 필요하다고 생각합니다.


앞서 언급한 것처럼, 스타트업에서는 분석 또는 엔지니어링의 대상이 되는 데이터가 존재하지 않거나 산재되었을 뿐더러 충분한 양이 존재하지 않는 경우가 많습니다. 이런 상황을 개선하기 위해 스타트업의 첫 데이터인 또는 조직은 데이터를 통해 확인이 가능한 인사이트 및 업무 개선의 예시를 구성원에게 공유하여, 데이터의 필요성을 전파하는 소위 데이터 에반젤리스트의 역할을 수행하게 됩니다. 이를 위해 다양한 도메인(마케팅, 영업, 운영, 개발 등)의 담당자와의 대화를 통해 진행 업무 및 업무 처리 방식을 이해하고, 어떤 데이터가 쌓이는지, 데이터의 ownership 그리고 잠재 활용 방안을 구상하게 되기에, 다양한 도메인과 상황에 따라 변화하고 성장 할 수 있는 데이터인이 필요하지요.


스타트업에서 데이터 관련 업무 수행 시 종종 경험하게 되는 문제들을 다루면서, 이를 해결하기 위해 필요한, 즉 제가 생각하는 스타트업의 데이터인으로서 필요한 역량 및 자세에 대하여 아래에 조금 더 구체적으로 다뤄보겠습니다.

스타트업의 초기 데이터인이 겪게 되는 문제

*스타트업에서 데이터인이 겪게 되는 문제

스타트업에서 데이터인이 겪게 되는 문제는 크게 3가지로 분류 할 수 있습니다. (위 이미지 참조)


[문제1] 먼저, 데이터의 ownership이 파편화되어 누가 어떤 데이터를 어떻게 활용하고 있는지 파악하는 데 많은 리소스가 요구되며, 설사 다양한 이해관계자와의 소통을 통해 데이터의 ownership을 파악하더라도, 데이터 수집 기준 (일/주/월 단위, 유저 단위, 코호트 단위 등)이 달라 영업, 마케팅, 운영 등 다양한 분야의 데이터를 통합하여 종합적인 분석이 불가합니다. 또한, 구성원들이 데이터인과의 충분한 협업 경험이 없는 경우, 현재의 데이터를 기반으로 수행가능한 분석 또는 데이터 활용 방안을 모르기 때문에, 단순하게 “지난달 유저의 활동량과 이번달 유저의 활동량을 뽑아주세요”와 같은 단순한 데이터 추출만 요청받게 됩니다. 소위 사람의 말을 SQL로 번역하는 쿼리 번역가가 되지요.


[문제2] 마찬가지로, 협업 경험이 부족하면 외부에서 접하게 된 신박한 데이터 작업들의 난이도 및 실질적인 효용을 인지하지 못하고 막연하고 정신이 아득해지는 업무를 종종 요청받게 됩니다. 구성원뿐만 아니라 데이터인(특히 규모가 크고 상대적으로 체계가 확립되어 있는 곳에서 근무했다면) 역시 다량의 데이터 확보 및 성능 개선(파라미터 튜닝)과 같이 다소 소모적이고 속도를 저해하는 요소들에 집중하여 데이터 분석의 효과를 구성원에게 효과적으로 전파하지 못하게 됩니다.


[문제3] 마지막으로, 측정과 분석을 통한 학습을 고려하지 않아 측정이 불가하거나, 데이터 관련 업무 처리 방식에 대한 사례가 공유되지 않아 같은 방식을 답습하게되는 경우도 존재합니다. “이번 달 매출이 다소 감소했어도, 슬슬 고객들의 반응이 증가하는 것 같아서 큰 문제는 없다고 평가합니다”와 같이 정량적인 지표(매출) 분석에 있어 다양한 요소들의 영향력을 측정하기보다는 정성적(고객 반응 증가)인 해석으로 결론을 도출하여 지표 측정의 의미를 감소시키는 문화 내지는 관행을 경험하게 됩니다. 이런 다양한 문제가 곳곳에 존재하는 스타트업에서 초기 데이터인으로서 살아남기 위해서는 어떻게 하는 것이 좋을까요?

밥값을 하기 위해 (문제해결 방안)

먼저, 현재 조직이 보유한 데이터와 데이터의 ownership을 파악하고, 이 데이터와 분석가의 현재 역량으로 해결 가능한 문제를 정의하는 것이 필요합니다. 


그리고 최대한 빠르게 많은 문제를 데이터로 해결하여 데이터 활용으로 인한 성과 창출의 사례를 다량으로 생산하는 것이 중요하지요. 또한 스타트업의 초기 데이터인은 “데이터를 사용한다면 이런 것도 가능하겠구나”와 같은 인식을 전파하여 구성원들로 하여금 데이터로 다양한 문제를 해결하는 상상을 가능케하는 것이 중요할텐데요. 이를 위해서는 다수의 데이터를 이용한 문제 해결 사례를 제시하여, 데이터 활용의 임팩트를 전파하는 것이 필요합니다.


빠르고 단순하게 해결가능한 문제 선별하기

속도는 곧 단순함을 의미하기도 합니다. 물론 복잡한 방법을 빠르게 적용 가능한 능력자도 있겠지만, 보편적으로 속도를 위해서는 단순함을 추구해야한다고 생각합니다. 즉, 다양한 기법과 요소들로 구성된 Google의 TFT (Temporal Fusion Transformer)를 활용한 DAU 예측 및 과거 이벤트의 효과 측정 보다는 단순한 이동 평균 기반의 모델링 기반의 결과를 제시하는 것이 옳다는 얘기이죠. 평생 수영을 해보지 않은 맥주병에게는 다양한 영법 및 수영의 효능을 얘기하는 것보다, 수영이 안전하고 물에서 움직이는 것이 편안하다는 것을 알려주는 것이 먼저인 것처럼, 고도화된 데이터 작업의 가능성을 제시하는 것보다는 당장 빠르게 문제를 해결하여 성과를 창출하는 것이 우선시되어야 합니다.


명확하고 결과가 예측되는 문제 선별하기

“성과 창출”은 기본적으로 직접적으로 비즈니스에 영향을 미치거나 또는 구성원들의 몰입도를 향상시킴으로써 비즈니스에 간접적으로 영향을 미치는 니즈들을 해소하는 것을 통해 가능합니다. 그렇다고해서 데이터인에게 요청되는 모든 업무들을 처리하는 것보다는, 필요사항이 명확하고 해결책이 즉각적으로 구상되는 니즈들을 해결하는 것이 좋고요. 해결책이 떠오르고 결과가 예측되지 않는 문제를 시도했다가, “최선을 다해봤지만, 이렇다 할 결과는 없었습니다”라는 식의 결과물을 제시하게 된다면 이는 곧 데이터의 필요성 및 활용안 자체에 대한 의구심을 증폭시키게 될 것이기 때문입니다. 스타트업에서의 초기 데이터인은 데이터로 일하는 것 자체를 대변합니다. 그렇기에 각 데이터인의 현재 역량을 기준으로 결과 및 해결방식이 떠오르지 않아 문제 해결 가능성이 모호한 경우 명확하게 의사표현을 하는 것이 좋다고 생각합니다.


가장 임팩트가 큰 문제 선별하기

추가로, 임팩트의 최대화를 위해서는 현상태가 가장 열악한 분야 또는 업무의 문제를 해결하는 것이 효과적입니다. J. F. 리비히의 최소량의 법칙에 따르면, 식물의 생산량은 필요한 여러 요소(수분, 온도, 양분 등) 중, 가장 부족한 요소에 의해 지배된다고 하는데요, 다르게 얘기하면 온도가 부족한 경우 아무리 많은 양분과 수분을 제공한다해도 큰 효과는 없다는 것을 의미하며, 마치 한계 효용 체감의 법칙처럼 충분한 요소를 보충하는 것보다 부족한 요소를 충원하는 것의 효과가 크다는 것을 의미합니다.


이는 비단 식물에게만 적용되는 법칙은 아니라고 생각하는데요. 만약 기존에 LTV를 나름의 기준으로 측정하고 분석하고 있는 경우, 이를 데이터로 고도화하는 것보다는 전혀 관련하여 업무가 수행되고 있지 않았던 이탈 예측을 진행하는 것의 효과가 크다는 것을 의미합니다. 스타트업이 혁신을 주도하고시장 내의 영향력을 확장하기 위해 전략적인 접근을 취하는 것처럼, 스타트업에서의 초기 데이터인은 전략적으로 데이터에 대한 인식을 전파할 필요가 있기 때문입니다.

맺음말

사실 구구절절 작성해 본 위의 내용은 지극히 개인적인 경험을 기반으로 작성되었을 뿐만 아니라, 다양한 데이터인 (데이터 엔지니어, ML 엔지니어, AI 연구원 등)을 모두 대변한다기보다는 데이터를 분석하여 문제를 해결하는 ‘데이터 분석가’의 입장에서 작성되었어요. 따라서 보편적으로 스타트업 또는 데이터인이 겪게되는 문제를 나타낸다기보다는, 그저 편협한 저의 경험일지도 모릅니다. 하지만 위의 문제 및 이에 대하여 제시하는 해결책들은 스타트업 또는 데이터인이 아니더라도 조직에서 한 분야의 기틀을 다지고 관련된 인식을 변화시켜야하는 선구자 또는 에반젤리스트로서 종종 겪게되는 문제임은 확실합니다.


마지막으로 스타트업에서 첫 데이터인으로서 커리어를 고민하거나 이미 데이터 업무를 수행하는 모든 데이터인에게 전합니다. 전문적으로 데이터 에반젤리스트의 역할을 수행하시며 다양한 조직에서 데이터의 활용성을 전파하는 전문가들도 존재하지만, 지금 그 곳에서는 당신이 최고의 전문가이자 에반젤리스트입니다. 화이팅!