다회차 수업
장소와 시간은 언제든 협의가 가능합니다. 노트북 꼭 지참하여 와주세요! 진심을 다해서 알고 있는 지식을 전달해드리겠습니다!
실시간 톡
₩20,000원 / 시간
₩240,000 / 총 4회 12시간
김종혁
Jong
[R 입문자 데이터 분석] 단계적으로 배우는 R 패키지! 데이터분석 입문용!
찜하기
  • 3시간/회
  • 최대인원:2~4
  • ₩20,000/시간

튜터정보

  • 성균관대학교 통계학과


- 성균관대학교 디지털헬스학과 석사 과정
- 성균관대학교 통계학과 졸업
- Smart Health Lab 인턴
- CDM(공통 데이터 모델) project 참여


- 성균관대학교 통계학회 PSAT 팀장
- LPOINT BIG DATA COMPETITION
- Kaggle 배틀그라운드 데이터를 활용. 계급별/유형별 클러스터링과 생존분석을 통한 맞춤형 전략 제시
- 외래관광객 설문 데이터를 활용. 회귀분석, 네트워크분석, 머신러닝 기법을 통한 최적의 관광가이드라인 제시
- Kaggle 대출 데이터를 활용. 모델 간 앙상블 기법(스태킹)을 통한 대출 금액 완납 가능성 예측 모델 제시

안녕하세요 김종혁입니다!

성균관대학교 통계학과를 나와서,
학회 활동과 공모전 경험을 통해서 R 프로그래밍 실력을 쌓았습니다.
현재는 성균관대학교 디지털헬스학과에 석사과정으로 입학 예정 중입니다.

보다 쉽고 재미있게 다양한 패키지들을 다뤄볼 생각입니다.
머신러닝을 활용한 데이터 분석 코스도 오픈할 예정입니다.
함께 하시는 모든 분들 끝까지 책임지고
많이 배워갈 수 있도록 도와드리겠습니다!

수업소개

<수업 목표>
제가 바라는 최종 목표는 다음과 같습니다.
1. 스스로 분석해보고 싶은 주제를 찾고
2. 주제에 필요한 데이터를 얻어내어
3. 전처리와 모델링을 통해 결과를 내고
4. 활용 방안까지 도출해 내는 것

[R Studio의 다양한 Package의 활용법, 단계적으로 배우자!]
다른 툴과 비교했을 때, R이 가지고 있는 최대의 장점은 다양한 Package를 가지고 있다는 것입니다. Package란 사용자들이 특정 주제에 대해 쉽게 쓰이는 코드들을 제3자가 이용하기 쉽도록 배포해 놓은 것을 말합니다.
R을 입문자가 다루기 어려운 이유는 바로 이러한 패키지를 사용하고 익숙해지는 것이 오래 걸리기 때문이라고 생각합니다. 제가 경험한 것에 의하면, 주요하게 쓰이는 패키지들은 나름 일련의 연관성을 가지고 있으며, 순차적으로 배웠을 때 비로소 그 쓰임새의 이유를 알 수 있다는 것입니다.
저와 함께 다양한 패키지들을 ‘제대로’ 배워봅시다!

[원하는 주제를 Kaggle과 공공데이터에서 찾아서 스스로 연습하자!]
제가 가장 중요하게 생각하는 것은 데이터분석을 어떤 분야에 적용해보고 싶은가 진지하게 고민해보는 것입니다. 본인이 관심있는 분야에서 문제점을 찾아내고 스스로 분석해서 나름의 의미를 도출한다면 비로소 데이터분석에 흠뻑 빠지게 될 것입니다.
하지만 원하는 분야의 데이터를 얻는 것이 생각보다 쉽지는 않습니다. 이러한 문제를 해결할 수 있는 방법이 바로 Kaggle과 공공데이터에 있습니다. 데이터를 얻는 것부터 데이터 분석의 시작입니다. 매주 본인이 선택한 데이터를 가지고 수업 때 배운 내용을 연습해 볼 수 있는 과제를 내주려 합니다.

*주의사항*
- 반드시 개인 노트북 지참할 것
- 수업료에 공간대여료는 포함되어 있습니다
- 강의 시간 꼭 엄수해 주세요!
- 질문 많이 해주세요! 다 함께 공부하는 분위기로 갑시다!

수업대상

  • <수업 대상>
    1. 데이터분석 입문자
    통계학회 팀장으로써, 데이터분석 경험이 없고 처음 접한 분들을 이끌었던 경험이 있습니다. 분석경험이 없더라도 오히려 본인만의 도메인 강점이 있으신 분들 격하게 환영합니다!

    2. 효율적인 코드를 짜고 싶으신 분
    주변에서 본인이 짠 코드를 해석하지 못하는 경우를 종종 본 적이 있습니다. 간결하고 누구나 보기 좋은 코드를 작성하는 능력을 기르고 싶으신 분들 환영합니다.

    3. 열정이 있으신 분들
    배우고자 하는 열정만 있다면 나이, 성별, 국적 불문 어느 누구나 상관없습니다. 함께 공부해 봅시닽!

    *주의사항*
    이 수업은 데이터 분석을 위한 전 단계라고 생각해 주시면 좋을 것 같습니다.
    내가 가지고 있는 데이터를 분석하기 좋은 형태로 만드는 과정이 본 수업에서 얻어갈 수 있는 부분입니다.
    이후 머신러닝을 활용한 데이터 분석 코스도 오픈할 생각입니다.

커리큘럼

1회차

- 수업 관련 OT

- R 기초

- Rmarkdown 사용법

- dplyr & magrittr

- 실습 & 과제

2회차

- 과제 공유

- tidyr

- ggplot(1/2)

- 실습 & 과제

3회차

- 과제 공유

- ggplot(2/2)

- stringr

- 실습 & 과제

4회차

- 과제 공유

- datatable

- 종합 실습
(실제 데이터로 모델링 전까지 전처리 및 시각화)

리뷰(2)

리뷰쓰기
5.0
  • 커리큘럼
  • 전달력
  • 준비성
  • 친절도
  • 시간준수

실시간톡

실시간 톡하기