강의 안내

학과 소개
R을 활용한 기계학습 실습(2)_심화(4주)
준비물 개인 노트북
담당자 (02-332-2145) help@bigdatacampus.co.kr

빅데이터 시대에 개인의 성공은 데이터를 분석 활용하는 능력,
즉 데이터를 이해하는 능력,
데이터를 처리하는 능력, 분석으로 인사이트를 뽑아내는 능력,
시각화하여 전달하는 능력에 따라 크게 좌우될 것이다

문제는 데이터를 분석, 활용하기 위해서는 통계를 알아야 하는데...
너무 많은 사람들이 통계에 자신 없어 한다는

  • 통계를 속 시원하게 이해시켜주는 강의가 어디 없을까?
  • 핵심을 콕 집어주는 강의가 어디 없을까?
  • 알맞은 사례 데이터로 실습까지 시켜주는 강의가 어디 없을까?

강의특징

단순히 통계 지식을 전달하는 통계 교육은 가라! R을 활용한 기초 및 고급 통계 단기 완성 통계 강 30년 경력의 세계적인 전문가가 사례 데이터 분석을 통해서 인사이트를 뽑아내는 능력을 키워주는 강의!

학과 소개
머신러닝 알고리즘들의 핵심을 이해시켜주는 강의 R을 이용한 머신러닝 적용 방법 실제 문제에의 적용 능력을 함께 향상
본 과정은 각 머신러닝 알고리즘의 원리 및 학습 방법에 대한 핵심을 쉽고 자세하게 설명하는 데에 중점을 두고 있습니다. 오픈소스인 R은 활발한 커뮤니티와 지속적인 패키지 업데이트를 통해 꾸준히 이용되고 있는 툴입니다. 본 과정을 통해 R을 이용하여 머신러닝을 적용하기 위한 데이터 전처리 및 실제 알고리즘을 적용하는 능력을 키울 수 있습니다. 실제 비즈니스 문제를 해결하기 위한 머신러닝을 적용하기 위해서는, 주어진 문제가 어떤 유형의 문제이며 어떤 알고리즘들을 통해 이를 해결할 수 있는지를 잘 파악해야 합니다. 본 과정에서는 지속적으로 문제 정의 및 해결 능력을 강조하여 수업을 진행할 예정입니다.

과정 목표

  • 머신러닝 알고리즘들의 이해
  • 실무 사례 중심교육
  • R을 이용하여 실제 데이터에 대한 분석역량 배양

4주 상세 커리큘럼

상세 커리큘럼 A
주차 학습 내용
1주
    < 학습 목표 >
  • · 연관 규칙 분석의 목적과 내용을 이해
  • · 대표적인 방법인 Apriori algorithm에 대하여 이해
    < 학습 내용 >
  • · 연관규칙 분석의 개요
  • · Apriori algorithm
    < R을 활용한 실습 >
  • · 연관 규칙 분석의 적용 실습
3주
    < 학습 목표 >
  • · 인공신경망 알고리즘의 이해
  • · 서포트 벡터 머신 (Support Vector Machine: SVM) 의 이해
    < 학습 내용 >
  • · 최적화에 대한 개요 및 Gradient descent 방법
  • · Feedforward neural network
  • · Support vector machine
    < R을 활용한 실습 >
  • · 인공신경망 및 서포트 벡터 머신을 실제 데이터에 적용 실습
상세 커리큘럼 B
주차 학습 내용
2주
    < 학습 목표 >
  • · 분류 규칙 도출을 위한 의사결정나무 계열의 알고리즘 이해
  • · 여러 모델을 동시에 적용하는 앙상블 방법에 대한 이해
  • · Random Forest를 이해
    < 학습 내용 >
  • · Classification and regression tree (CART)
  • · 앙상블 방법 – Bagging and Boosting
  • · Random Forest
    < R을 활용한 실습 >
  • · CART를 이용하여 분류 규칙 도출 실습
  • · Random Forest를 활용한 분류 모델링
4주
    < 학습 목표 >
  • · 텍스트 데이터의 수집 및 전처리 과정에 대한 이해
  • · 텍스트마이닝에 대한 이해
    < 학습 내용 >
  • · 텍스트마이닝의 기본 과정 이해
    < R을 활용한 실습 >
  • · R을 이용한 웹 데이터 스크래핑
  • · 한글 및 영어 텍스트를 전처리 및 마이닝하는 실습

교수 소개

고태훈 강사 사진
    고태훈 교수
  • · 서울대학교 산업공학과 학사 졸업
  • · 서울대학교 산업공학과 박사과정 재학 중
  • · 현재 삼성 멀티캠퍼스 및 패스트캠퍼스에서 머신러닝 및 딥러닝 강의 진행 중
    • [ 소개 ]
    • · 고태훈 강사님은 서울대학교 산업공학과 데이터마이닝센터에서 현재 박사과정을 진행하고 있습니다. 삼성전자, LG전자, 현대자동차, 현대중공업, 두산인프라코어, 현대카드 등 다수의 업체와의 협업을 통해 실제 비즈니스에 연결되어 있는 데이터를 규명/분석하고 머신러닝 기법을 적용하여 현업에 적용할 수 있는 연구를 꾸준히 진행하였습니다. 고태훈 강사님은 실제 비즈니스에서 적용 가능한 데이터마이닝 프로세스, 그리고 이에 적용 가능한 기법을 찾아서 연결하는 데에 필요한 기법들을 연결하는 데에 관심이 많습니다.

자주묻는 질문

자주묻는 질문
통계 및 데이터 분석에 대해 전혀 배운 적이 없는데 이 과정을 수강할 수 있나요? 본 과정에서 크게 이슈가 되는 딥러닝(Deep learning)에 대한 수업도 이루어지는 것인가요?
통계 및 데이터 분석에 대해 과거 공부를 하셨거나 경험이 있는 분들이 수업 이해도 부분에서 분명 이점을 갖습니다. 그러나 알고리즘의 기본 원리를 이해하고 이를 실제 문제에 어떻게 적용해볼 것인가에 대한 부분은 사전지식이 없는 분들에게도 큰 도움이 될 것입니다. 본 과정에서는 본격적으로 딥러닝을 다루지는 않습니다만, 딥러닝의 근간이 되는 주요 머신러닝 관련 이론들을 충분히 다루고 있습니다. 또한 최적화, gradient descent, 인공신경망 (본 수업에서 다루는 것은 feedforward neural network) 에 대한 수업을 진행하므로, 향후 딥러닝에 대하여 꾸준히 공부를 하실 의향이 있는 분들에게는 이론적 기반을 다질 수 있는 커리큘럼을 갖고 있습니다.

수강료

수강료
일반등록가 88만원
얼리버드 할인가 48만원

평일반 수강 신청 (얼리버드 할인 중) 주말반 수강 신청 (얼리버드 할인 중)