기초 통계부터 실전 데이터 분석까지.
통계학 교과서만 보면 어려운 개념, 실제 데이터가 동반되는 프로젝트를 통해 쉽게 이해하자.
기초만 하고 끝나지 않습니다. 실전에서 활용되는 심화 개념까지!
주차별로 체계적인 강의부터 1대1 피드백을 받을 수 있는 프로젝트까지!
누구를 위한 스터디인가요?
통계학을 처음 배우거나 잘 모르시는 분들을 위한 과정입니다. 통계학은 데이터 분석, 공학, 의학, 심리학, 사회과학, 정치 등 다양한 분야에서 쓰이고 있습니다. 어떤 업무를 하고 있던 기초 통계학에 대한 개념과 실제로 데이터를 분석할 수 있는 능력은 필수가 되어가고 있습니다. 언젠가 데이터 분석과 통계학을 배우고 싶다고 생각했던 또는 기존에 대학교나 다른 곳에서 통계학을 배웠으나 다시 기초부터 심화까지 배우고 싶으신 분들, 그때 배울 때는 도저히 이해가 안 가고 어디에 써먹는 지 알 수 없었던 분들을 위한 스터디입니다.
기존 스터디에서는 데이터 분석 입문을 위해 통계학을 배우려는 분들부터 현업에서 통계가 필요하여 공부하시는 분들, 대학원생 중 논문 통계 분석이 필요하여 참가하신 분들 등 다양한 분들이 참가해서 스터디를 진행했습니다.
왜 통계학인가요?
데이터 분석은 기본적으로 탐색적 자료 분석(이하 EDA)이라는 과정부터 시작하는데 이때 데이터의 분포, 변수 간 관계, 시각화 등 다양한 방법을 통해 데이터를 분석하게 됩니다. 단순한 데이터 프로젝트의 경우일수록 이 과정에서 어떠한 인사이트를 얻게 되고 예측 분석이 목표일 경우 이 과정을 선행한 후 머신러닝 알고리즘을 이용하여 예측 분석을 하기도 합니다.
EDA라는 과정, 즉, 데이터의 분포, 변수 간 관계, 히스토그램, 산점도, 상관관계 등을 파악하는 과정 자체가 바로 우리가 흔히 말하는 통계학에서 다루는 주제들입니다. (통계학을 모르면 할 수 없다는 얘기죠.)
선수 지식은 무엇이 필요한가요?
선수 지식은 따로 없습니다. 소위 평균이라는 개념부터 시작하여 어려운 심화개념까지 갈 예정입니다. 스터디에서 통계용 언어인 R을 사용합니다. 그래서 기존에 프로그래밍 언어를 조금 다뤄보았으면 도움이 됩니다. 하지만 몰라도 기초부터 알려드릴 예정입니다.
이 커리큘럼을 통해 무엇을 얻어갈 수 있고 무엇을 하나요?
통계학에서 기본이 되는 평균, 분산, 표준편차 등의 기술 통계 개념과 데이터 분석을 할 때 기존 데이터에 이런 다양한 통계량을 어떻게 시각화하는지 R 언어와 ggplot2 라이브러리를 이용하여 다양한 그래프를 그려볼 수 있습니다. 또한 기존 데이터를 분석하는데 그치지 않고 통계적 추론을 통해서 어떻게 데이터를 통해서 도출해 낸 결과를 일반화하고 앞으로 들어오는 새로운 데이터를 예측하는 법까지 배우게 됩니다. 다양한 통계 개념을 손으로 직접 계산도 해보고 R을 이용하여 쉽게 도출해보면서 기초 이론부터 실제 데이터 분석에서 활용되는 스킬까지 배우는 것이 이번 커리큘럼의 목표입니다.
다른 클래스와 무슨 차별성이 있나요?
어려운 수식과 확률 개념을 최소한으로 필요한 부분에서만 다루며 대부분 이론 설명과 실습을 병행하게 됩니다. 통계학을 다른 곳에서 공부하면 개념만 공부하거나 중요한 이론을 생략하고 의미를 모른 채 실습에만 치중하는 경우가 많습니다. 기존에 여러 번 통계학 스터디를 운영하면서 이론과 실습을 균형 있게 가져가고 '이걸 배워서 어디다가 써?' 또는 '도대체 이게 무슨 의미야?' 라는 의문이 최소화되게끔 커리큘럼을 구성하였습니다. 통계학도 배우고 싶고 내가 실제로 데이터 분석하는데 써먹을만한 스킬도 얻고 싶다면 이 스터디에 꼭 참여해보세요.