위치

요일

가능
시간
(날짜)

  • 오전6시 ~ 밤 2시(언제든 가능) (협의)
장소 : 온라인
추가비용 : 없음
* 모든 수강생기준 강의날 하루에 반드시 1번이상의 제출 / 전체 모델링은 의무적으로 경험하게되시며, 전체강의가 끝날때까지 기본적으로 최소 2개의 대회, 많은분은 3개의 대회까지 소화 가능하십니다! 또한 그 대회들에서 상위1%~5%의 성적을 달성할 수 있음을 약속 드립니다. * 첫수업은 1:1로 진행되는편인데, 요새는 첫수업부터 바로 대회를 진행하며 수업하고 있습니다.
₩18,500원 / 시간
₩148,000 / 총 4회 8시간
실시간 톡하기 찜하기
오정훈
캐글 폐인
캐글/데이터분석 빛의속도로 최상위권들기, 머신러닝
  • 온라인
  • 2시간/회
  • 최대인원:3~5
  • ₩18,500/시간

튜터정보

  • 한양대학교 산업공학과
*19년 3월 8일 - 감사 인사 올립니다!!

현재 탈잉에서 처음으로 강의 시작한지 한달정도 되었는데, 온라인 수업임에도 불구하고 많은 관심가져주셔서 정말 감지덕지한 마음이고.. 다들 너무 감사드립니다! 항상 수업진행에있어서, 대답도 잘해주시고, 수업 끝날때마다 정말 재밌었다고 말씀해주실때마다 너무 뿌듯합니다!! 재수강 삼수강 연장수강 앞으로도 계속 잘부탁드립니다!!


-------------------------------------------------------------------------------------------
매일 하루 14시간 캐글하며 데이터분석과 함께 살았습니다.
맨땅에서부터 시작해 수많은 시행착오와 좌절로 단련되었습니다.
캐글 데이터 분석 Competition 대회를 약 90여개 해보면서(사진 참고) 과연 무엇이 모델성능개선에 가장 핵심인지 잘 알고있고, 수강생 여러분들이 빙빙 돌며 길을 잃지 않고, 지름길로 갈 수있는 방법을 제공할 수 있다고 자신합니다!

빠르게 모델 점수 획득, 모델성능개선, Kaggle 리더보드 등수 올리기, 데이터분석 시간을 효율적으로 분배 및 최적화 등등, 입문자, 초보자분들도 천천히 상세하게 알려드립니다!

특히 왜 이런식으로 하면 모델 성능이 오르는지, 점수가 개선되는지에대한 '이유'를 명확히 제시하는 수업이고, 현재 수강생분들도 수업이 끝날때마다 너무 많은것을 얻어간다고하시고, 오늘 하루도 배운게 많아서 뿌듯하다고 하십니다!!

일방향으로만 향하는 수업은 지양합니다. 항상 튜티님의 뇌 근육이 자랄수 있게 상황별 질문을 드리고 그에 대한 답변을 여러분이 잘 해낼 수 있도록 어떻게든 힌트를 드리며 혼자 힘으로 상황을 해결 할 수 있도록 이끌어 드리려고 노력합니다.

지식만 전달하는 수업은 아닙니다. 수강생분들이 실제로 몸소 느끼고 경험할 수있는 환경또한 제공하며 고기를 ' 잡는법 ' 에 대해서 치열한 고민을 하게 만들어 드립니다.



* 중학생, 고등학생, 고3 / 재수생등 수능과외경력 8년동안, 그냥 자기 혼자만 지식을 많이 아는것과, 상대방에게 설명을 해서 이해시키는 능력은 완전히 다르다는것을 뼈저리게 느꼈습니다. 다양한 실력의 많은 학생들을 지도해본 결과, 그들의 입장에서 기초에서부터 차근차근 설명하지 않으면 아무리 꿀지식이라고 하더라도 대부분 전달되지못하고 날아가버린다는것을 깨달았습니다. 항상 학생이 완전하게 이해하고 본인이 직접 실습가능 할때까지 반복시켜드리겠습니다.

* 현재 수강하시는분들의 실력분포도가 매우 다양합니다..! 그렇기 때문에 효율적인 맞춤수업에 있어서 비슷한 실력의 튜티님들끼리 수업진행이 가능하다는점 말씀드리고 싶네요~

* 취미로 했던 온라인 게임관련 분석 컨텐츠 조회수 1300만회 달성 경험이 있습니다. 관심받는것을 좋아해서 학생의 피드백을 항상 요구하며, 대답잘하는 학생을 좋아합니다!

수업소개

수강생의 실력과 위치에 맞는 수업을 지향합니다.
가독성이 높아 최대한 이해하기 쉬운 코드작성을 통해 빠른시간안에 완료된 대회들 순위권안에 들 수 있는 노하우 제공합니다!

데이터 분석 입문자들이 가장 많이 하는 실수들에 대해서 아주 뼈저리게 알고 있습니다. 그 순간 순간들을 고통스럽게 대부분 경험해보았기 때문입니다. 그러한 스트레스에서 해방시켜 드리겠습니다.
(원하시면 스트레스받는 환경안에서 퀘스트깨는 것처럼 진행해드릴 수 있습니다.)

* 타이타닉, 집값예측, 자전거 수요예측등 튜토리얼 같은 데이터 분석 입문 대회는 빠르게 상위1~2%안에 들 수 있는 방법을 제공합니다. 그냥 코드 복붙이아닌, 실제로 문제상황을 정의하고 데이터를 이해함과 동시에 혼자힘으로 다시 모델 성능을 Reproduce할 수 있는 능력을 제공하고자 노력합니다.



수준별 실력에 따른 맞춤식 제공
기본적인 캐글 / 데이터 분석 강의 커리큘럼은 이미 준비되어있지만, 수강생의 수준과 요구사항에 따라 수정 변경가능합니다.
데이터분석 이론과 기법을 아무리 많이 알아도 실제로 분석을 진행하려고하면 막히는 현상. 다들 많이 경험해보셨을 것이라고 생각합니다. 수업의 전반적인 진행은 맹목적인 이론의 열거, 설명이 아닙니다. 실제로 적용을 못하면 죽은 지식이라고 생각합니다. 데이터를 분석하고 모델의 성능을 끌어 올리는데에 있어서 가장 빠른 지름길을 선택해서 실습수업을 진행하며, 순간순간 꼭 필요한 이론을 효율적으로 전달해 드립니다. 우리의 뇌는 우선순위가 불확실한 지식을 한번에 많이 받아들이지 않습니다. 먼저 제가 수많은 오류와 비효율을 겪어보았으니, 특정 데이터분석에 있어 꼭 기억해야할 핵심내용만을 각인시켜드려서 얻어갈 만한게 많은 수업이 되도록 노력하겠습니다.

* 모든 수강생기준 강의날 하루에 반드시 1번이상의 제출 / 전체 모델링은 의무적으로 경험하게되시며, 전체강의가 끝날때까지 기본적으로 최소 2개의 대회, 많은분은 3개의 대회까지 소화 가능하십니다! 또한 그 대회들에서 상위1%~5%의 성적을 달성할 수 있음을 약속 드립니다.

* 첫수업은 1:1로 진행되는편인데, 요새는 첫수업부터 바로 대회를 진행하며 수업하고 있습니다.

수업대상

  • 머신러닝 / 캐글입문자 / 파이썬 데이터분석

    1. 타 전공자지만 데이터 분석에 관심이있어서 입문하려고하는 경우(맨땅에서부터 시작한 경험이 있기때문에 동병상련의 마음으로 잘 이끌어드리겠습니다. 처음시작하며 제가 느낀 고통들을 느끼지 않도록 하겠습니다.)

    2. 빅데이터 분석, 국비교육등 분석관련 외부 강의는 수강했으나 내가 정말 실제 데이터를 잘 다룰 수 있을까에 대한 두려움으로 실제로 캐글 competition에 참여하지 못한경우

    3. 전공자거나 캐글을 들어는 봤지만 실제로 캐글아이디만 있지 실제로 직접 혼자힘으로 데이터를 모델이 다루기 편하게 전처리하고, 모델링, 예측, 검증, 제출 파이프라인을 경험해보지 않았거나 일부만 경험해본 경우

    4. 캐글 어느정도 해봤고 기본적인 대회들에 대한 제출경험은 있지만 리더보드에서 높은 순위를 달성하지 못했거나, 어딘가에서 현재 stuck되어 있고, 지금 현재 본인의 상태에서 어떤 방향으로 나아가야하는지에 대한 전체적인 인사이트를 얻고 싶은 경우

    5. 로컬환경이나 트레인 데이터셋에서는 모델 성능이 매우 잘나오지만 꼭 새로운 데이터를 처리하거나 처음보는 unseen 데이터를 가지고 예측할때마다 모델 성능이 급격하게 떨어지는 경우

    6. 본인만의 데이터분석 포트폴리오 작성시 누구나 흔히 사용하는 문구들인 "~대회에서 입상했습니다. ~데이터를 다뤄본 경험이 있습니다. "을 떠나
    "실제 어떤 대회에서 이러한 데이터를 가지고 어떤 문제점이 있는지 파악했으며, 데이터 분포와 구성을 보니 다른모델들 보다 특히 XX모델이 가장 강력한 성능을 발휘 할 것 같다는 생각으로 (그냥 아는 모델 아무거나 사용해보는것이 아닌) 데이터 분석을 진행하여 ~%의 예측정확도와 상위X%의 성적을 모델링 시작한지 몇시간안에 달성할 수 있었습니다. 더욱 개선을 위해 앞으로 나아가야할 방향은 ~~입니다. "와 같은 디테일과 분석방향에 대한 명확한 근거를 언급하고 싶으신분

커리큘럼

1회차

1. 수준을 알아야 효율적인 수업진행이 가능하다고 생각합니다.
학생 개개인의 데이터분석 실력과 캐글경험에 대해서 전반적으로 파악합니다.

2. 수업의 방향성
수강생분이 어떤 방향의 수업(이론중심 or 실습중심)을 원하시는지, 어떤 분야에 관심이 있으신지(정형데이터, 비정형데이터), 어떤 대회를 특히 경험해보고 싶어하시는지에 따라 커리큘럼이 수정될 수 있습니다.

3. 바로 대회 시작!
첫날 바로 대회를 시작해서, 보통 2~3개월 정도 진행되는 대회를 2시간만에 모두 겪어보실수 있습니다. 데이터 전처리부터 모델링까지 모두 다루며, 빠르게 진행한다고해서 중요한 부분을 경시하고 넘어가지 않습니다. 머신러닝에 있어서 중요하다고 생각되는 부분은 반드시 이해시키고 실습하며 넘어갑니다.

2회차

데이터분석 및 모델 베이스라인 구축 전체 파이프라인 초급기술 및 꿀Tip 설명

* 헛짓하며 삽질해서 시간낭비하는 데이터분석은 그만!

- 대부분의 대회에 적용되는 가장 기초적이면서도 중요한 분석기법 학습
1. 카테고리형 데이터, 문자열 데이터등 모델이 NONO! 하며 거부하는 데이터, 우리의 모델이 먹기좋게, 소화하기 쉽도록 변신작업! 시작!
2. 결측치, missing value에 대한 상세한 처리방식 학습 및 그 이유

- 빠르게 인사이트를 얻기위한 보조 tool로써의 데이터 시각화 활용(데이터 시각화가 주가 되는 수업이 있는데 사실 시각화는 데이터를 빠르고 쉽게 이해하고 앞으로의 분석방향을 잡기위한 보조적인 툴일뿐이지 데이터분석 및 모델 개발에 있어서 삐까뻔쩍한 시각화가 주가되면 안됩니다!)

- 데이터 맞춤식 모델 선택의 중요성
1. 좋은 모델이라고 아무모델이나 사용한다? NO!
모델에게 학습을 일임하는게아니라, 사용자가 직접 모델이 소화하기 좋게 데이터를 정제하고, 그 데이터를 잘 처리할 수 있는 특정 모델을 골라야 우리의 행복한 모델이 기분좋게 뛰어난 성능을 내는 현상을 만끽할 수 있습니다!

2. 좋은 모델을 골랐으면 그에 맞는 하이퍼파라미터 튜닝이 필요하다!
항상 성능을 극대화하기 위한 튜닝은 중요하지만 튜닝만 몇시간이 걸려버린다 ..?
여기서 함정은 과연 무엇이고, 과연 어떤 튜닝 방식을 사용해야 제한된 시간내에 최적의 파라미터를 찾을 수 있을까?

3회차

데이터분석 및 모델 베이스라인 구축 전체 파이프라인 중급기술 및 꿀Tip 설명

- 지난시간에 진행한 대회에서 검증 및 제출한 모델 성능을 어떻게하면 더더욱 끌어올릴 수 있을까? 우리가 놓치고 있는 부분을 뭘까? 고민하고 토론하며 진짜 최상위권으로 도약하기 위한 준비

- 끝까지 어떻게든 최후의 1%의 성능이라도 잡아내려는 마음가짐이, 남들과 다른 우월한 점수를 낼 수 있는 핵심! 과연 그 핵심 방법에는 무엇이 있을까?

- 어떤 위기 상황이 닥쳤을때, 어떻게 하면 그 상황을 헤쳐나갈 수 있을까?
데이터분석과정은 너무나도 고통스러운 시간.. 혼자 하려고하면 막혀서 앞으로 나아가지를 못하는데, 최소한의 힌트를 드리면서 튜티님들이 혼자힘으로... 어떻게든 해결할 수 있도록 어떻게든!! 발판마련!

4회차

* 텍스트마이닝 / 이미지데이터 관련 딥러닝 수업문의에 대해서 안내해 드리겠습니다.

제가 정형데이터 만큼 비정형데이터에 대해서 숙련도가 높은 상황은 아닙니다. 하지만 음성 데이터 관련, 자연어처리, 이미지 분류대회, 이미지 픽셀 분류 대회등등 많은 경험을 쌓으며 어떻게든 추후에 수업이 가능하도록 노력, 연마하고 있습니다.

텍스트마이닝관련은
1. 영화리뷰 / 감정분석 대회
2. 구글 Word2vec Bags of Popcorn 대회
3. 문장만 보고 어떤 작가가 쓴 글인지 분류하기 대회
4. 전세계 요리재료 텍스트로 실제 어떤요리인지 예측하기 대회
등과 같은 대회에서는 캐글 리더보드기준 상위1% 정도의 점수를 뽑아낼 수 있음을 알려드립니다.



이미지관련 대회는 현재 object classification or Semantic Segmentation 관련 몇몇 완료된 대회정도에 한해서만 수업진행이 가능하며, Instance Segmentation, Object Detection 등등을 활용해야하는 대회같은 경우에는 저또한 많이 부족함을 알고 있으므로 현재 공부하고 있는 상황입니다. 추후에 이부분또한 강의가 가능할정도로 실력이 올라왔을시에 수업관련 내용을 공지해 드리겠습니다.


머신러닝에 있어서 MLP 딥러닝 기법을 사용한 수업은 몇몇 머신러닝 대회를 진행할때 같이 진행하고 있습니다~

리뷰(5)

리뷰쓰기
5.0
  • 커리큘럼
  • 전달력
  • 준비성
  • 친절도
  • 시간준수

실시간톡

실시간 톡하기

위치

지도가 들어갑니다.