요일

가능
시간
(날짜)

  • 오전 10시-정오 (협의)
장소 : 협의 후 결정
추가비용 : 스터디룸 사용료 각자부담 (5천원가량)
수업 장소는 스터디룸을 예약해서 결정되면 신촌, 종각중 한군데로 알려드립니다. *. 스터디룸 사용료는 각자 부담합니다.
₩39,000원 / 시간
₩312,000 / 총 4회 8시간
실시간 톡하기 찜하기
한창훈
QuantPsy
기초통계 이론과 함께하는 R 데이터 분석(시각화, 전처리)
  • 신촌홍대, 종로
  • 2시간/회
  • 1:1 수업
  • ₩39,000/시간

튜터정보

  • 국민대학교 컴퓨터공학과
  • 성균관대학교 심리학과
  • 대학원석사수료
*. 소개
- 성균관대 심리학과 일반대학원 계량심리 석사(Quantitative Psychology) 2019년 2월 졸업

- 계량심리는 간략히 1)심리 검사/측정, 2)자료분석/통계모형, 3)연구방법론을 다루는 학문입니다.

※. 필요하시면 과외 진행 시, 졸업증명서와 연구실 홈페이지 링크를 보내드립니다.


*. 약력
- 한국 심리측정 평가학회 2017년 추계학술대회, 포스터 발표
다차원성이 있는 요인구조의 모형설정
: 아동용 웩슬러 지능검사 5판에 이인자모형과 2차요인모형을 적용하여

- 한국형 아동용 웩슬러 지능검사 5판(K-WISC-V) 표준화연구 검사자 참여

- 한국형 아동용 웩슬러 지능검사 5판(K-WISC-V) 규준(norm)제작 프로젝트 참여
: 분석자료 전처리, 사전분석, 채점기준에 따른 소검사점수 재환산,
IRT(문항반응이론)분석 - WISC-V 문항별 난이도/변별력을 산출하여 제외문항 선정 및 문항순서 조정


*. 관심분야
- 구조방정식 모형(Structural Equation Model), 측정 동일성(Measurement Invariance),
지능검사(Intelligent Assessment), 문항반응이론(Item Response Theory)


*. 학위논문
- 정렬법을 이용한 2차 요인 모형의 요인 평균 비교와 차별문항기능 분석 : WISC-V 지능 요인의 연령에 따른 차이

- 측정 동일성(Measurement Invariance)이 위배될 때 대안적 접근방법(정렬법- Alignment)을 확장함.

- Mplus의 alignment 분석을 동일한 결과를 산출하도록 R로 직접 구현하고 분석옵션 일부를 추가함.

- 2019년에 지도교수님과 해외저널에 학위논문 revision하여 논문 투고예정.

- 주 참조논문 1
Asparouhov, T., & Muthén, B. (2014).
Multiple-group factor analysis alignment.
Structural Equation Modeling: A Multidisciplinary Journal, 21(4), 495-508.

- 주 참조논문 2
Marsh, H. W., Guo, J., Parker, P. D., Nagengast, B., Asparouhov, T., Muthén, B., & Dicke, T. (2018). What to do when scalar invariance fails: The extended alignment method for
multi-group factor analysis comparison of latent means across many groups.
Psychological Methods, 23(3), 524-545.



*. 사용 가능한 통계 분석 도구
- 학위연구에서 상용 통계분석툴(Mplus)에서 제공하는 current한 특정 분석기법(Alignment)을 R로 직접 구현하여 동일한 결과를 산출하도록 재현하고 분석 옵션 일부를 추가하였습니다.

- 학부에서 컴퓨터공학을 전공하여, R과 같은 프로그래밍 언어를 능숙하게 사용합니다.

- 주로 사용한 도구는 R, Mplus, SPSS이며 필요에 따라 통계분석 도구를 자유롭게 사용할 수 있습니다.

- 통계 분석 툴은 SPSS를 기본으로 알려드리고, 경우에 따라 필요하다면 R을 고려합니다.

수업소개

*. 수업 구성
제 수업은 크게 두 파트로 이뤄집니다.

1> 기초통계 이론에 대한 배경지식 습득

2> 1>을 기반으로 하여 가지고 있는 자료를 R로 효과적으로 시각화 하는 방법


※. 첫 수업시간은 1시간 수업비용과 스터디룸 사용료만 부담하시면 됩니다.
 그리고 첫 수업시간은 1시간 30분 진행합니다.



*. 기초통계와 자료분석을 함께 다루는 이유.
탈잉의 여러 데이터분석 강좌들을 둘러봤습니다.

다수는 프로그래밍으로 분석기법 위주의 강좌들이 많이 보였습니다.

일부는 기초통계 이론이나 배경지식에 대한 강의들도 있었구요.

자료분석은 데이터를 단순하게 특정 기법으로 분석해서 제시하는 기술이 아닙니다.


내가 이 자료를 왜 분석해야 하는지 ? 이 자료에서 보여주려는 특징은 무엇인지 ?

그러한 특징을 보여주기 위해서는 어떤 분석을 적용할 수 있는지 ?

자료를 보다 효과적으로 분석하여 보여주기 위해서는 어떻게 해야 하는지 ?

해당 분석에서 자료의 특성을 보여주지 못하는 부분은 무엇인지 ?


이러한 부분을 이해하고 스스로 생각하려면 통계학적인 시각이 필요합니다.

제가 수업에서 다루는 기초통계는 거창한것이 아닙니다.

가장 쉽게는,

수능에서 표준점수를 사용하는 이유는 무엇때문인지 ?
표준편차를 동일하게 맞춰서 표준화 한다는 것은 무슨 뜻이고, 왜 하는지 ?

나아가서, 당장 용어가 조금 생소하겠으나

분산, 설명량(R-square), 잔차(residual)는 무슨 의미인지 ?
상관관계, 인과관계의 차이

기본적이고 단순한 통계 개념이지만 실질적인 의미를 이해하도록 도와드릴겁니다.

수강생분께서 분석결과의 의미를 타인에게 설명하여 이해시킬 수 있을 정도로
통계지식에 대해 스스로 정리되는 것을 목표로 합니다.



*. 자료분석 기술외에 분석자료 전처리, 결과해석에 대해서 배웁니다.
결과를 해석하기 위해서는 앞서 말한 기초통계지식이 필요합니다.

그리고 사실 분석보다 더 많은 시간이 할애되는 것이 자료 전처리입니다.

내가 원하는 형태로 분석이 가능하도록 자료를 가공해야하기 때문이죠.

기본적으로 내장된 자료들은 대부분 깔끔하게 정리되어있지만,

실제로 현장에서 분석을 하게되면 그렇지 않습니다.

자료가 잘못 입력된 경우, 오류나 순서를 수정하는 일.

특정 자료만 필터링 하거나 자료를 재구성 하는 일 등등.

전처리를 반드시 할 수 있어야 분석이 가능해집니다.

따라서 제 수업에서는 필요한 정도로 간단하게 자료 전처리를 다룰 것입니다.



*. 제가 밸런스 있는 기초통계, 자료분석 강의를 제공할 수 있는 이유.
데이터 사이언스는 크게 3가지 요소로 구성된다고 할 수 있습니다.
(최하단 튜터영상 유튜브 링크 참조)

1) 통계학적인 지식
2) 컴퓨터나 툴을 다뤄서 자료를 정리하고 분석하는 기술
3) 응용/ 적용분야에 대한 배경지식

저는 학부전공이 컴퓨터공학이라 어느정도 프로그래밍에 대한 배경지식이 있었구요.

계량심리는 심리학 내에서 연구방법론, 측정, 통계분석을 다루는 전공입니다.

따라서 통계적인 배경지식과 심리학의 내용분야에 대한 배경지식이 있습니다.


이전까지는 제가 R로 시각화나 간단한 기술통계적 분석을 자주 하진 않았어요.

주로 심리학에서 쓰이는 고급 통계모형(주로 구조방정식 관련)을 다뤘어요.

하지만, 한국형 아동용 웩슬러 지능검사 결과자료를 분석할 때

자료를 전처리 해서 분석하고 시각화하여 요약하는 경험이 계기가 되었어요.


따라서 저는 수업에서 1) 통계 배경지식, 2) 분석 테크닉, 3) 자료 전처리/결과해석
을 고루 알려드릴 수 있습니다.

셋다 물론 중요하고 제 수업에서 이를 모두 충분히 다루기는 어렵습니다.

하지만 제가 전반적인 기초는 탄탄하게 닦아드릴 수 있다고 자부합니다.


※. 걱정이 되시면 첫번째 시간은 1시간 수업비용만 지불하시고 판단해보셔도 좋아요!

수업대상

  • *. 통계, R에 대한 이해가 거의 없으신 입문자나 기본수준의 튜터를 대상으로 합니다.

    통계에 대한 기본적인 지식과 이해를 갖추고 싶으신 분.

    R로 간단한 자료 분석을 하고싶으신 분.

    사회과학, 심리학, 교육학의 내용과 관련된 공부, 일을 하고 계신분.

    데이터 분석을 하기위한 전반적인 기초 배경지식을 다지고 싶으신 분.


    *. 아래와 같은 분들은 제 수업과 방향성이 달라요.

    텍스트 마이닝과 같이 숫자로된 정형화 데이터 이외의 자료를 다루고 싶으신분

    머신러닝, 딥러닝에 대해서 배우고 싶으신 분

    통계지식, 자료분석 실력이 중급~고급에 해당하시는 분

    단순한 분석 기법이나 툴 사용법만을 위주로 배우고 싶으신 분

    통계 이론과 배경지식을 배울 필요가 없다고 생각되시는 분

커리큘럼

1회차

수업 OT
※. 첫번째 수업은 1시간 비용만 지불 하시면 되고 수업은 1:00 ~ 1:30 진행합니다.

기초통계 : 평균 등 대표값의 의미, 표준편차, 표준화를 하는 이유 ?

R : 기본적인 사용법 & 설정, 산점도, 자료의 분포 요약

2회차

기초통계 : 단순회귀, 상관과 인과관계, 설명량의 뜻.

R : 선/ 막대 그래프, 단순회귀

자료 전처리

3회차

기초통계 부족한 부분, 튜터의 목적에 필요한 부분 추가 강의

R 시각화 응용 및 1/2회차 수업에서 부족했던 부분 보충 & 추가.
: 주석, 축 조정, 범례, 면 분할(facet), 한 화면에 여러 plot 그리기, 색 설정

4회차

수강생분께서 적용하고자 하시는 분야에 대한 분석 기법들을 추가 실습
ex. 여러 통계모형(위계적 회귀분석, 구조방정식 모형 등)
기타 고급 분석방법들(차원축소-요인분석, 주성분 분석)

4회차 내용은 논의하여 진행하거나, 이전내용에서 깊이 다룰 부분들을 심화수업 합니다.

튜터영상

리뷰

리뷰쓰기

실시간톡

실시간 톡하기

위치

지도가 들어갑니다.