본문 바로가기

전체 글184

[독서] 데이터 과학자 원칙 📚 독서 - 데이터 과학자 원칙 • 저자 : 권정민, 권시현, 김영민, 김진환, 박준석 저 외 4명 정 • 출판사 : 골든래빗 (2023년 06월 01일) 📌 p94 🏷️주니어 데분이 흔히 하는 실수와 함정 - ML을 사용할 때에는 문제 정의가 중요하다. 많은 시간과 도메인 지식을 투자해서 문제를 정확하게 정의해야 한다. 때로는 ML로 해결할 필요가 없다는 결론이 나올 수도 있다. 사용자 유입이 목표라면, 추천 알고리즘 보다는 훌륭한 사용자 경험이 더 효과적일 수도 있다. -ML을 사용할 수 없을 때에는 사용하지 마세요 : ML은 복잡한 학습 패턴이 존재하고 충분한 데이터의 수집이 가능하며, 예측으로 발생하는 비용이 낮을 때에 사용하는 것이 적절하다. ex) 중요 정책을 결정할 때에는 ML이 적절하지 않.. 2023. 8. 26.
[크롤링] 셀레니움 Chrome driver 버전 문제 해결 셀레니움을 사용 시 매번 Chrome 버전에 맞는 webdriver를 다운받아서 사용하는게 여간 번거로운 일이 아니었다. 그래서 그동안 webdriver_manager 를 이용해서 자동으로 맞는 버전을 탐색해서 설치하는 방식을 사용하였는데, 셀레니움 버전 4.11 이 업데이트되면서 그것조차 할 필요가 없어졌다! 셀레니움 v 4.11.2 부터는 명시적으로 크롬드라이버를 다운로드할 필요가 없으며, webdriver manager를 이용할 필요도 없다. 내 로컬 환경에 필요한 브라우저(크롬, 파이어폭스, 엣지) 등이 다운로드만 되어있으면 된다. https://stackoverflow.com/questions/76849633/selenium-4-11-2-with-chromedriver-and-chrome Sel.. 2023. 8. 20.
[팀 프로젝트] 블록체인 Social Buzz 데이터 분석 및 암호화폐 거래량 예측 📚 블록체인 Social Buzz 데이터 분석 및 암호화폐 거래량 예측 📌 프로젝트 개요 분석 목적 - 5개 암호화폐 거래소의 Social Buzz 데이터 분석 - 거래소 Social Buzz 데이터와 암호화폐 거래량의 인과관계 파악 - Social Buzz 데이터를 이용한 암호화폐 거래량 예측 모델 사용 데이터 블록체인 Social Buzz 데이터, 암호화폐 거래 데이터 분석기간 2022.09.01~2022.12.19 역할 모델링, 결과 발표 사용언어 및 Tool 태블로(시각화), R, Python 좋은 기회를 얻어서 블록체인 데이터 분석 기업인 카탈라이즈 리서치(Catalyze Research)와의 산학협력 프로젝트를 진행하였다. 카탈라이즈 리서치는 Web3 업계의 회원사들을 대상으로 투자, 컨설팅,.. 2023. 7. 30.
[SQL] CASE WHEN / CREATE FUNCTION 📚 CASE WHEN 📌 문법 -- 방법1 CASE WHEN 조건식1 THEN 결과1 WHEN 조건식2 THEN 결과2 ELSE 결과3 END -- 방법2 CASE [컬럼] WHEN 조건값1 THEN 결과1 WHEN 조건값2 THEN 결과2 ELSE 결과3 END• 방법1은 조건식을 직접 입력하는 방식이고, 방법이는 컬럼을 지정하고 해당 컬럼에서 참거짓을 판별할 조건값을 입력하는 방식이다. • ELSE 생략 시 NULL 값을 반환함 📚 함수 만들기 📌 문법 CREATE FUNCTION [함수 이름] ([입력값 이름] [데이터 타입], ......) RETURNS [결과값 데이터 타입] BEGIN DECLARE [임시값 이름] [데이터 타입] SET [임시값 이름] =[입력값 이름] 쿼리; RETURN 결.. 2023. 5. 9.
[팀 프로젝트] 이동통신사 고객 데이터 분석 및 이탈예측 모델 제안 📚 이동통신사 고객데이터 분석 및 이탈예측 모델 제안 📌 프로젝트 개요 분석 목적 이동통신사 고객 데이터를 분석하고 이탈 예측 모델을 제안 사용 데이터 Cell2Cell 데이터 분석기간 2021.11 ~ 2021.12 역할 분석, 발표, 문헌조사 사용언어 R 연세대 석사과정 Business Analytics 수업에서 진행했던 프로젝트이다. 경진대회가 아니라서 그동안 학습한 내용들을 분석 과정에서 최대한 활용하고, 인사이트를 도출하고자 하였다. 실제 국내 통신사 고객 데이터를 사용하였으면 좋겠지만, 사실상 불가능하기 때문에 캐글에서 공개된 데이터셋을 이용하였다. 분석 결과를 통해 생각보다 유의미한 패턴과 의미를 발견할 수 있었고, 교수님과 같은 수업을 듣던 학우들에게 좋은 평가를 받았던 프로젝트였다. 2023. 5. 7.
[책] 영업은 결과로 말한다 📚 책 - 영업은 결과로 말한다 • 중소기업~스타트업인 기업에서 결정 권이 있는 사람들을 대상으로 영업의 이야기를 다룬 책이다. 나처럼 기존 체계나 프로세스가 마련되어 있는 조직에서 신입으로 일하는 사람에게는 맞지 않는 부분들도 있겠지만, 그래도 중간중간 느끼는 점이 많았다. 개인적으로 입사 후에 회사에서 영업 + 마케팅 일도 하게 될것이라고는 생각지 못했었기 대문에, 걱정도 되고 방향을 잡지 못하는 상태였다. 그럼에도 이 책을 통해서, 영업 부서는 회사의 심장과 같은 역할을 한다는 것을 알았고, 내가 하는 일이 근본적으로 매우 중요하고 회사에 기여할 수 있다는 것을 알게되었다. • 기업 내부를 보면 궂은일은 꺼리고 멋진 일만 하려고 하는 사람들로 넘친다. 영업은 궂은일이지만 그만큼 중요한 일이다. 영업.. 2023. 4. 22.