데이터 기획 및 분석을 시작하게 된 이유
·
경험 공유
학부 시절, 창업 활동을 하며 프로젝트를 발표하고 피드백 받으며작은 결정 하나에도 근거와 논리가 필요하다는 것을 알았다. 이를 해결해주었던 것은 데이터였다.나는 새로운 인사이트를 얻고 설득을 위한 근거를 마련하기 위해 이러한 데이터를 더 잘 들여다 볼 필요가 있었다. 학교와 연계해서 진행하는 데이터 분석 교육 과정을 신청했고,수료 이후에는 배운 내용을 바탕으로 현실의 문제를 해결하고 싶어 곧바로 취업했다. 실무에서는 데이터 분석 및 기획 업무로 일을 했다.경영학과 전공과 창업 활동 당시 프로젝트 팀장을 맡았던 경험을 토대로, 수치에 근거하여 논리적으로 의견을 제시하는 데 자신이 있었다. 어쩌면 나는, 부족한 논리를 보충하기 위한 '수단'으로써 데이터에 입문하게 되었지만점점 데이터 그 자체에 매력을 느끼..
[캐글 필사] Housing Price - Random Forest
·
기술 스택/Python
진행일 : 2022.10.27 - 2022.10.30 데이터셋 정보 https://www.kaggle.com/code/swathianil/starter-housing-price-random-forest Starter: Housing Price | Random Forest Explore and run machine learning code with Kaggle Notebooks | Using data from Housing Prices Competition for Kaggle Learn Users www.kaggle.com | Housing Prices Competition: Ames Housing dataset 주택 가격 예측을 위한 데이터셋 - 79개의 설명변수는 Ames, Iowa 주거 지역의 특징을..
[부스트코스] Data Science 스터디
·
기술 스택/Python
부스트코스 코칭스터디 https://m.boostcourse.org/study-ds112-2022/lectures/369459 [코칭스터디 8기] Data Science 스터디 전용강좌 부스트코스(boostcourse)는 모두 함께 배우고 성장하는 비영리 SW 온라인 플랫폼입니다. m.boostcourse.org | 부스트코스 코칭스터디란? 부스트코스 파이썬으로 시작하는 데이터 사이언스 강좌를 매주 수강하고 팀원과 함께 미션을 수행하며 코치의 피드백과 현업 개발자의 라이브 강의를 시청하는 온택트 스터디 이다. 팀 학습은 팀끼리 진행한다. 각 팀은 부스터 4명과 리드부스터 1명으로 구성된다. 리드부스터는 팀 내 커뮤니케이션과 팀 활동을 주도, 부스터(나)는 강좌 수강 및 퀴즈 풀이 후 동료 부스터들과 함께..
[캐글 필사] EDA - Data Scientist Salaries
·
기술 스택/Python
진행일 : 2022.10.21 ~ 2022.10.27 데이터셋 정보 https://www.kaggle.com/code/tunaeem/eda-data-scientist-salaries EDA - Data Scientist Salaries Explore and run machine learning code with Kaggle Notebooks | Using data from Data Science Job Salaries www.kaggle.com 목차 Introduction EDA(Exploratory Data Analysis) 데이터 관찰 범주형(Categorical) 변수 분석 수치형(Numerical) 변수 분석 타겟(target) 변수 분석 상관(Correlation) 분석 함수화(Functiona..
파이썬 데이터 시각화 라이브러리
·
기술 스택/Python
sns.catplot(x = 'Embarked', kind = 'count', data = all) python 시각화 라이브러리 Seaborn 그래프 종류 Categorical plots barplot countplot boxplot violineplot stripplot swarmplot boxenplot pointplot catplot sns.histplot(data=all['Fare'], kde=True) plt.show() Distribution plots histplot kdeplot ruglpot ecdfplot distplot (위의 모든 그래프 통합개념) kde : 커널밀도추정(Kernel Density Estimate, KDE) hitogram보다 부드러운 형태의 분포 곡선을 보여줌 D..