위치

요일

가능
시간
(날짜)

  • 오후 7시~9시 (협의)
장소 : 협의 후 결정
추가비용 : 토즈등의 스터디룸 비용
토즈등의 스터디룸 비용은 각자 부담합니다.
₩25,000원 / 시간
₩200,000 / 총 4회 8시간
실시간 톡하기 찜하기
Daniel
토토프렌즈
실무역량 Level up - 머신러닝/딥러닝 입문
  • 신촌홍대
  • 2시간/회
  • 최대인원:2~6
  • ₩25,000/시간

튜터정보

  • 한양대학교 전자컴퓨터공학부
비전공자에 대한 풍부한 교육 경험과 실적.
- 데이터 분석 분야 완전 왕초보부터 실무자 수준의 지도 경험(R/Python)
- (현) 빅데이터 실무자 양성 과정 담당

실무 경력
- KT 고객 로그 분석 및 통계
- 영상 통화 고객 로그 분석
- [일본] 신제품 빅데이터 수집 및 분석 프로그램 설계 및 기능 개선
- [일본] 영상처리 및 Health기기 디지털정보 수집 및 분석 프로그램 연구개발
- [일본] 쇼핑몰 및 일본 최대 통신회사 시스템 엔지니어
(기타)

교육 경력
(현) 빅데이터 실무자 양성 과정 담당 진행 (머신러닝 with R/Python)
(전) 빅데이터 대학원 인공지능 입문 과정(Python) - 남서울 대학교
(전) 초보자를 위한 데이터 분석 입문(Python 과정) 진행 - 인공지능 아카데미

수업소개

# 파이썬 Level-up 이후의 심화 수업입니다.
# 현재는 파이썬 Level-up 수업 들으신 분들을 대상으로 합니다.
# 6월달 부터 수업 시작 예정입니다.

- 이번 수업은 파이썬에 대해 약간의 지식을 가지고 있는 것을 필요로 합니다.
* 듣고 싶을 경우, 파이썬을 모르는 분들은 파이썬 기본 학습 후, 수강이 부탁드립니다.

- 미래를 예측하여 문제를 푸는 방법(알고리즘)인 머신러닝이 무엇인지 알아봅니다.
- 주어진 실제 데이터를 이용해 대형 사고의 생존자를 예측하는 실습을 해 봅니다.
- 자전거 공유 대여 업체의 실제 데이터(날씨 등)를 이용해 자전거 대여수를 예측하는 실습을 합니다.
- 아래의 집 값에 영향을 미치는 실제 데이터와 머신러닝을 이용하여 집 값을 예측하는 알고리즘을 만들어봅니다.

==> 머신러닝이라는 것의 학습을 통해 실제 데이터를 이용해 현실 문제를 풀고, 미래의 결과를 예측할 수 있는 것에 대해 이론과 실습을 통해 알아봅니다.

- 수업에서는 다음과 같은 내용에 대해 학습해 봅니다.

(1) 기본 예측 모델을 만들어 머신러닝 기본 개념에 대해 이해해 봅니다.
가. 머신러닝에 대해 알아봅니다.
나. 머신러닝의 종류에 대해 알아봅니다.
다. 기본 예측 모델을 만들어, 자전거 대여수를 예측해 봅니다.
라. 예측 모델을 만들어, 생존자 수를 예측해 봅니다.
마. 다양한 머신러닝 알고리즘인 의사결정트리, 랜덤 포레스트 등을 실습과 함께 알아봅니다.

(2) 머신러닝 모델을 만드는 것과 함께 시각화, 데이터 처리, 머신러닝 라이브러리(프로그램)에 대해 이해해 봅니다.
기본 라이브러리 :
Pandas(데이터 처리에 이용)
Scikit Learn(머신러닝 알고리즘에 이용)
Matplotlib, Seaborn(데이터 시각화에 이용)
Numpy(수치 계산을 위한 부분에 이용)

(3) 머신러닝 모델(알고리즘)을 만들고 모델의 성능을 개선시키는 것에 대해 알아봅니다.
A. 어떤 Field(변수)[예측에 사용된 데이터]가 의미가 있을까?
B. 데이터 열(변수, Field) 선택은 어떻게 해야 할까?
C. 데이터 조합을 통한 새로운 열(Field, 변수)을 어떻게 만들까?
D. 이상치(정상 범위 외의 값) 및 결측치(데이터가 비어있는) 처리는 어떻게 해야할까?

* 머신러닝 기법을 이용하여 현실 문제를 해결해 가는 Kaggle 대회의 데이터 셋을 이용합니다.

(4) Python 과 많이 사용되는 유용한 프로그램을 머신러닝 실습과 함께 알아봅니다.
A. 구글 클라우드 Python 실습 환경 colaboratory를 사용해 보기
B. Jupyter notebook or lab 사용해 보기

수업대상

  • 수업 대상
    - Python을 공부 후, 머신러닝을 입문하고자 하는 분
    - Kaggle 대회를 알지만 대회에 참여해 보지 못하신 분
    - 회사와 학교에서의 데이터 셋을 이용해 보고 싶은 분
    - 빅데이터 분야에 관심을 가지고 있고 이 분야에 대해 알고자 하는 분

    비추천
    - 머신러닝에 대해 어느정도 이해를 가지고 계신분
    - Kaggle 대회를 두번 이상 참여해 보신분
    - Scikit-learn과 Pandas를 업무에서 활용하고 있으신 분.

    ## 수업 신청 전, 수업대상자로서 맞는지 문의를 부탁드립니다.

커리큘럼

1회차

(1) 머신러닝 입문 및 기본 라이브러리 알아보기
A. 머신러닝 소개
B. 머신러닝을 위한 기본 라이브러리 알아보기
B-1. 시각화(Matplotlib)
B-2. 데이터처리(Pandas)
B-3. 머신러닝(Scikit-learn)
--> 구글 클라우드 환경 Colaboratory 이용.
C. Bike Sharing Demand 대회에 참여해 봅니다.

2회차

(2) 머신러닝 데이터 분석(1) - 스타트업 자전거 공유 대여수 예측(2)
사용 데이터 : Bike Sharing Demand
A. 데이터 시각화(Seaborn 이용)를 이용하여 데이터 탐색을 수행해 봅니다.
B. 데이터 처리(Pandas 이용)를 feature(변수) 생성을 수행해 봅니다.
C. 의사결정트리와 랜덤포레스트 모델의 생성하고 이를 비교해 봅니다.
D. 모델 성능 테스트를 위한 교차 검증에 대해 알아봅니다.
-- Jupyter notebook or lab 사용해 보기

3회차

(3) 머신러닝 데이터 분석(2) - 기본 통계 개념 이해해 보기
사용 데이터 : [Kaggle]Titanic: Machine Learning from Disaster
A. 데이터의 시각화를 다양한 방법으로 해보고 이에 관련된 기본 통계에 대해 알아봅니다.
- Hisgram(히스토그램), Boxplot(상자그림), Scatter(산점도)
B. 데이터의 열(변수)들 간의 어느정도 관계가 있는지 알아봅니다.(상관분석)
C. Field Engineering - 열(변수) 선택 및 삭제
D. 우리가 만든 모델을 어떻게 평가하는 알아봅니다.

4회차

4) 머신러닝 데이터 분석(3) - 미래의 주택가격 예측
사용 데이터 : House Prices: Advanced Regression Techniques
A. 군집 분석의 이해(K-mean 알고리즘)
B. 배운 내용을 활용한 주택가격 예측 모델 만들기(상관분석, 회귀분석 등)
C. 이후의 공부할 것들(Tensorflow[딥러닝 라이브러리]) 맛보기 등

리뷰

리뷰쓰기

실시간톡

실시간 톡하기

위치

지도가 들어갑니다.