본문 바로가기
데이터 분석/일반

데이터 사이언스 현직자 인터뷰 정리

by 장찐 2021. 12. 31.

 

 요구 역량 변화

• 테크니컬한 기술셋은 많이 사용해봐야 느는걸 실무진들도 알고 있고, 신입들의 스킬이 많이 상향평준화된 상태 
• 대부분 개발 환경을 클라우드로 구성하기 때문에 서버 구축하는 등 인프라 구축이 용이해져서 규모가 작은 회사도 환경이 좋아지고 있다. 

 

• 과거에는 채용 시 통계적인 지식에 대해서 얼마나 잘 알고있는지를 물어봤다면, 

  몇년 전에는 그 통계 지식을 실제 문제상황에 적용해본 경험이 있는지를 물어봤었고

  현재는 문제 상황에 적용해서 결과를 내고 액션까지 시도해봤는가를 중점적으로 본다. 

• 그렇기에 분석가 혼자서 다할순 없고 같이 협업하는 사람이 PO다 그러면 프로덕트 개선이 되는거고 디자이너도 붙었다 그러면 UX까지 가는 것이죠 


데이터 분석가에게 현실적으로 필요한 역량 

1. 문제를 해결하고자 하는 강한 마음
2. 해당 도메인에 대한 주도적 학습능력
3. 통계에 대한 이해
4. R/Python을 이용한 데이터 분석(AI포함)
5. SQL


미국 트렌드 

• DS는 이제 거의 모델링에서 벗어나서, A/B테스팅과 통계 위주. 모델링은 이제 AI researcher나 AI/ML SWE 직책이 생김 

• DS는 A/B테스팅을 하기위해서 Model에 대한 이해도는 대걍 필요하고 기술적인 능력보다는 통계 이해도가 매우 높아야되는 추세입니다.

 

• Facebook 같은 경우 현업 팀 구성이 DS :1 / backend SWE : 2 / DE : 2 / UI/UX designer : 2 입니다.

 

•  예를 들어, 모바일 광고를 할 경우 해당 광고가 효과가 있었는지 A/B테스팅으로 분석한다. 

그래서 DS는 AB테스팅과 통계 분석으로 이러한 내용들을 분석하고, 다시 SWE, UX 디자이너와 상의해서 수정한다. 

 DS가 코딩을 하긴 하지만 통계 분석과 미팅을 통한 협업이 강조되는 추세이다. 

 


 

✅ 데이터 분석 직군 트렌드 변화

 

 

 

DS의 역할은 회사마다 다르다. Product Analyst, Business Analyst, CRM, Marketer 등등 회사마다 다르다. 

 어떤 경우엔 DS라고 하지만 DA 역할을 하는 경우도 있고딥러닝하는 곳도 있다. 최근에 딥러닝 직군은 AI Researcher, Research Scientist 등등으로 점차 분류되어 가고 있다. 
데이터 관련 교육도 많아서 사업, 마케팅, PM 일을 하시다가 데이터 분석 업무로 넘어오는 사람도 많아지고 있다. 

데이터 직군에서 제일 중요한 부분은 문제 정의 역량과, 정의한 후 어떻게 할지 판단하고 실행하는 부분이다. (기술적인 부분은 그 다음) 

실제 현업에서 일하시는 분들은 보면, 계속해서 공부해가면서 다른 업무를 하게 되는 경우가 많다. 데이터 애널리스트로 시작한다고 해서 반드시 그 업무에 계속해서 고정되는 것이 아니다. 

 


✅ 2021 한국경영정보학회 추계학술대회, Data Analytics, 민병석(LG CNS) 

 

 

 

• 통계를 기반으로 분석하는 기업과 머신러닝을 사용하는 기업들이 나뉘어지고 있음 

 

 

 

 

• 과거에는 비즈니스 전문가와 IT 전문가 사이에 소통이 쉽지 않았다. 

• 최근에는 그 사이에 데이터 분석가가 들어가서 소통이 더 어려워진다. 즉, 데이터 분석가에게 커뮤니케이션 능력은 매우 중요한 역량이다. 

 

 

 

•과거에서 소수의 DS가 있었지만, 최근에는 Citizen Data Scientist가 많이 증가하고 있다. 즉, 전문가에 대한 수요보다 비 전문가의 공급이 증가하고 있다. → AutoML 등이 사용됨 

 

•분석 업무가 과거에는 통계를 기반으로 레포팅 하는 것이 위주였음. 최근에는 회사의 모든 분야에 대해서 업무의 지능화가 이루어지고 있음 

 

•분석가들이 분석에만 집중할 수 있도록 업무 환경이 변화하고 있음 

 


 

✅ 윤서현 (IT 업계, 데이터 사이언티스트) 

https://www.youtube.com/watch?v=V2ATT-K4xDI 

 

✔ 어려웠던 점 

 데이터 사이언티스트에게는 실제로 필요한 데이터가 없는 경우가 많다. 이러한 경우에는 필요한 데이터를 직접 수집하는 과정을 거쳐야 한다.

 이 이터뷰에서는 욕설 필터링 모델을 만드는 과정이 굉장히 어려웠다고 하셨다. 욕설 데이터를 수집하기 위해서 댓글을 크롤링 한 후에 수작업으로 필터링을 진행했는데, 욕설을 매번 보는 것 자체가 정신적으로 굉장히 힘든 일이었다고 한다. 그래서 데이터가 충분하지 않았음에도 딥러닝으로 학습을 실시하였고 결국 실패하게 되었다. 

 

→ 즉, 데이터 사이언티스트에게는 필요한 데이터가 없는 것이 가장 큰 어려운 점이며, 필요한 데이터를 직접 수집하는 일도 자주 발생한다. 

 

✔ 자주 협업하는 팀 

• 데이터 사이언티스트에게 요구되는 핵심 역량 중 하나는 의사소통 능력이다. 윤서현님은 주로 소통하는 부서는 개발팀과 마케팅팀이라고 한다. 양 팀에 모두 필요한 데이터를 요청하는 경우가 많다. 

 

✔ 조언 

• 공모전에 적극 참여하면서 많은 경험 쌓기. 특히, 분석의 이유, 목적, 결과를 명확하게 설명할 수 있어야 하고 깃허브로 잘 관리해서 포트폴리오로 만들어야 한다. 

 

 


✅ 데이터왔수다 빅데이터 포트폴리오  

• 배운 내용을 그대로 베껴서 포트폴리오를 작성하는 것은 의미가 없다. 더군다가 새로운 기법을 단순히 적용해 봤다고 해서 그것이 나의 장점이 되지는 않는다. 분석 과정에서 어려웠던점과 어떻게 해결했는지에 대해서 나의 고민이 잘 드러내야 한다. 

 

→ 어느 부분을 고민했는지를 작성하면, 면접 때에도 면접자 입장에서 질문거리가 생긴다. + 면접에서 배우고 싶다는 자세를 강조할 수 있기 때문에 호의적인 인상을 남길 수도 있다. 

 


✅ 비효율의 숙달화 

KT의 신수정님 링크드인에서 퍼왔습니다.

•  일터에서 벌어지는 최악의 상황 중 하나는 '비효율의 숙달화'입니다. 엄청나게 비효율적인데 시간이 지나다보니 나름 요령이 생기고 숙달이 되는겁니다. 그러면, 자신이 일하는 방식이 엄청나게 비효율적이라는 사실을 잊어버립니다. 그러면서 자신은 하루 고생하며 열심히 일했다고 생각합니다.

•  예전에, 한 조직에서 복잡한 업무를 엑셀의 여러 다양한 기능을 조합해서 업무를 하였습니다. 엄청 복잡해서 새로운 직원이 이를 숙달하는데 까지는 몇개월이 걸렸습니다. 근무기간이 길수록 잘 썼습니다. 어느날 한 sw개발자가 그걸보고 훨씬 쉽고 간단하게 처리할수 있는 전산시스템을 만들수 있다고 했습니다. 그런데 흥미롭게도 그 부서 고참들은 새로운 시스템 만들기를 거부했습니다. 이미 과거 시스템에 숙달되었고 그걸 자유롭게 쓰는것이 그들의 구력이요 능력이라 여겼기 때문이죠. 흥미롭게도 수많은 조직들이 말도 안되게 노동집약적이고 시간을 많이 잡아먹는 소위 '닭질'을 변화시키지 않습니다. 이유는 단순합니다. '숙달되었기' 때문입니다.

•  500개 시스템에 유사한 명령어를 치는 운영자가 있었습니다. 맨 처음에는 하나하나 치다가 그 다음에는 복사와 붙여넣기로 했죠. 조금 나아지긴 했지만 여전히 시간이 걸렸죠. 그래도 숙달되니 나름 적응하게 되었습니다. 그것을 소프트웨어 로봇화하면 그걸 아예 안할수도 있는데 그렇게 하지 않습니다. 왜입니까? 첫째는 숙달되었고 둘째는 그 일을 안하면 자신이 할일이 없어진다는 생각이 든거죠.

• 신입사원으로 들어왔을때는 말도 안되는 비효율이 눈에 보였는데 이상하게 시간이 지나면 적응하게 되고 대리나 과장 쯤되면 매우 자연스러워집니다. 왜인가요? 비효율이 숙달되었거든요. 그리고 숙달되면 자기가 신입사원보다 잘 하게 되고 이미 기득권이 된겁니다. 그러니 그 비효율적인 시스템은 고쳐지지 않고 생명을 유지하게 됩니다. 그러니 원대한 뜻을 품고 입사한 유능한 젊은 직원들이  단순노동에 치입니다.

•  이러하니 'Transformation' 이 잘 안됩니다. Change와 Transformation의 차이는 전자는 현상태를 조금 낫게하는것인 반면, 후자는 완전 새로운 변환입니다. 전자는 더 좋은 마차를 만드는것이지만 후자는 자동차를 만드는것이죠. 전자는 더큰 애벌레가 되는것이지만 후자는 나비가 되는것이죠. 그러나 우리는 현재일이 큰 문제 없다고 여기고 그 일에 바빠서 Transformation을 하려하지 않습니다.  숙달되서 조금 나아지지만 여전히 바쁘고 '닭질'을 하는 경우가 많습니다.

•  이렇게 하게 하는것은 사실 여러분이 아닌 저 같은 리더의 책임입니다. 리더들이 Transformation을 실험할수 있도록 판을 깔아주고 그것을 인정해주면 다들 새로운 차원의 고민을 합니다. 그러나 리더들이 그것에 관심없고 현재일만 챙긴다면 여러분들이 Transformation을 시도할 이유가 없을 겁니다. 당장 바쁜데 그것까지 고민할 이유가 없고, 해도 인정 못받고, 해봤자 남는 시간에 다른 일만 더 줄 것이고, 오히려 지금까지 익숙해져서 나름 쌓아왓던것을 스스로 무너뜨리는 것 밖에 되지 않으니까요. 그러나 더 나은것은, transformation이 리더의 일시적 의지나 구성원만의 일시적 열정으로가 아니라  회사의 자연스러운 문화로 정착되는 것일 겁니다.

•  항상 우리 스스로에게 물어봅시다. 우리는 '비효율을 숙달해서 혁신의 필요성을 잃어버린 것이 아닌가?' '고객과 외부자가 볼때는 말도 안되는 비효율을 우리는 너무도 자연스럽게 받아들이는것은 아닌가?' '우리는 나비가 아닌 더 나은 애벌레가 되려 하는것은 아닌지?'

댓글