• 다회차
  • 1명

이미지와 텍스트 추출 및 DB 관리를 위한 웹크롤링 및 분석 실무

Yong Dam Kim 튜터 5(1)

클래스 전 숙지해주세요!

스터디룸에서 진행합니다.

튜터 공지

이런 분들이 들으면 좋아요.

✔️ 많은 행정일에 지치신 분들
✔️ 자동으로 데이터 처리를 원하시는 분들
✔️ 회사에서 자유시간을 가지고 싶은 분들
✔️ DB와 OCR의 기본 개념을 배우고 싶은 분들
✔️ 웹크롤링, 연관어 분석 기법 같은 기본 텍스트 마이닝 기법이 궁금하신 분들

모두 환영합니다!!

튜터님을 소개합니다.

Yong Dam Kim

  • 서강대학교 컴퓨터공학과
  • 서강대학교 컴퓨터공학과
  • TOPCIT 특별상
  • 탈잉 튜터교육 참석

✔️ 프로젝트
- 해시태그 기반 소셜 데이터 분석을 위한 적응형 클러스터링 기법
- 반도체 공정과정에서의 유사 문제 해결을 위한 지식 네트워크 검색 시스템 개발
- 웹크롤링 코퍼스 정제를 위한 지능형 텍스트 정규화 시스템 개발
- 박물관 방문 동기 분석을 위한 소셜 빅데이터 분석 시스템 개발
- SK그룹 ATCL 2기 비정형 데이터 프로젝트 리더 및 멘토링


안녕하세요.
저는 현재 서강대학교 빅데이터 연구실에서
그래프 뉴럴넷을 이용한 추천시스템 연구하고 있는 YongDam 튜터입니다 :)

매일 연구실에서, 때때로 강의를 통해서
현업종사자 분들, 박사분들과 함께
다양한 프로젝트를 진행해오고 있습니다.

어떤 클래스 인가요?

파이썬 기초부터 시작해서, 웹크롤링을 통해 데이터를 모으고,

모은 이미지와 텍스트 데이터를 이용하여 업무 자동화를 진행하는 단기 클래스입니다!

클래스는 이렇게 진행됩니다.

1회차 커리큘럼

- 기초 파이썬 문법 Remind (data type, if, for, function)
- 파이썬을 이용한 web crawling

2회차 커리큘럼

- 관심 있는 웹페이지를 선정하고, 작성한 크롤러로 데이터 전처리
- beautifulsoup4, selenium, scrapy를 이용하여 실전 크롤러 제작 및 연습

3회차 커리큘럼

- 데이터 관리를 위한 데이터베이스 제작 방법 연습
- sqlite와 실제 DBMS 사용을 위한 mysql 실습

4회차 커리큘럼

- 수집한 텍스트 데이터 분석을 위한 빈도분석, wordcloud
- 텍스트의 의미 정보 추출을 위한 Semantic Network Analysis 및 연관어 분석

- 수집한 이미지에서 텍스트 정보를 추출하기 위한 OCR(Optical Character Recognition)
- opencv를 통해 간단한 실전 OCR model 만들기

실제 수강생의 리뷰입니다.

  • 커리큘럼5
  • 전달력5
  • 시간준수5
  • 준비성5
  • 친절도5

클래스 일정

신촌홍대

36,300원 / 시간 871,200원 / 총 4회 24시간