내손으로 자연어처리 with Python | 감정분류와 포털뉴스 검색 프로젝트
사례를 통해 배우는 이론과 직접 내손으로 구현하는 NLP 프로젝트
Description
초급자를 위해 준비한
Python 언어로 배우는 자연어 처리 강의입니다.
강의 한줄 소개
- 인터넷 페이지, 다양한 문서 등 텍스트에서 유사도를 판단하고 분류하는 자연어처리 기술을 다루는 강의입니다.
내손으로 체화하는 파이썬 실습
- Google Colab으로 복잡한 설치 없이 간편하게 실습합니다.
- 파이썬 개발환경에서 데이터를 가져오는 다양한 방법(zip 파일 읽기, 경로를 찾아 다운로드 받기 등)
- 인공지능/데이터사이언스에서 자주 사용하는 패키지(scikit-learn, Keras, TF, numpy 등)을 경험합니다.
- 영화 리뷰를 하나의 데이터로 긍정/부정을 분류하는 프로젝트를 구현합니다.
- 포털뉴스에 자주 사용되는 RSS 데이터 중 원하는 기사를 검색하는 프로젝트를 구현합니다.
핵심 내용
자연어 기초 이론
- 딥러닝 기반 자연어 처리 개념
- 웹 문서에서 자연어 추출하기
- 추천 및 검색 시스템의 기초
- 워드 임베딩(Word- to Vector)
텍스트의 이해
- 파이썬 함수로 데이터 전처리하기
- 문장 전처리 및 데이터 시각화
감정분류기 설계
- 데이터 전처리 구현, 실제 데이터로 구현하는 프로젝트
신문기사 검색엔진
- 검색엔진 개요와 검색 기본함수
- 데이터 전처리
- 신문기사 검색기 구현 및 응용
What You Will Learn!
- 텍스트 데이터의 유사도를 표현하는 TF-IDF의 이론과 실습을 통한 이해를 배우게 됩니다.
- 같은 단어의 수와 형태소 등 다양한 방법으로 유사도를 판단하는 접근을 배우게 됩니다.
- 텍스트를 벡터화 한 후 각 문장 간의 유사도를 측정하는 딥러닝 기반 방법을 배우게 됩니다.
- 자카드 유사도, 코사인 유사도, 유클리디언 유사도, 맨하탄 유사도 등
- 영화 리뷰 데이터, RSS 포털 뉴스 검색기 등 실제 프로젝트를 통해 NLP 기본 기술을 배우게 됩니다.
Who Should Attend!
- 텍스트를 이용한 자연어 처리의 원리와 프로젝트를 경험해보고 싶은 학습자
- 포털뉴스 검색기, 영화 리뷰 데이터 처리 등 데이터 분석의 기초를 경험해보고 싶은 학습자