Skip to content

keongmini/netflixschool

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

405 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

넷플릭스쿨(NetfilxSchool)

영어 공부하기 좋은 작품 추천 서비스 '야 너두 영화 자막없이 볼 수 있어!'

1. 프로젝트 소개

사용자의 영어 레벨을 평가하여 영어 레벨에 맞는 영화, 드라마 추천

사용할 데이터 세트

  • 기준 영단어 데이터 - 다양한 영어 레벨을 나누는 기준을 찾아 레벨을 나눌 수 있는 영단어 데이트 세트
  • 대본 데이터 - 넷플릭스에서 인기있는 작품들을 구글링으로 대본 자료 획득 후 데이터 전처리

사용할 데이터 세트를 통해 얻고자 하는 인사이트

  • 기준 영단어 데이터를 통해 작품의 대본에 포함된 단어들과 비교하여 작품의 난이도를 설정
  • 대본 데이터, 자막 데이터 - 대본 데이터의 단어와 자막 데이터의 시간을 이용하여 단어로 인한 난이도, 말하기 속도로 인한 난이도를 정하는 지수를 얻을 수 있음

데이터 세트 분석 과정 중 예상되는 어려움

  • 기준 영단어의 퀄리티가 영어 레벨을 나누는데 중요한 역할을 하기 때문에 기준 영단어 데이터 세트를 어떻게 만들지 고민이 된다.
  • 대본 데이터에서 단어 데이터를 뽑아내는 것은 하였지만 온전한 문장을 필터링 하는 전처리 방법을 구현하여야 한다.
  • 자막 데이터를 통해 작품의 말하기 속도를 수치화시켜야 한다.
  • 단어의 난이도와 작품 말하기 속도를 통합하여 난이도를 구체화하여야 한다.

2. 프로젝트 목표

문제 정의와 가설 설정 방법

문제의 정의
  • OTT를 사용하는 다양한 목적 중에는 쉐도잉을 이용하여 영어 공부를 하는 케이스도 있다. OTT에는 다양한 작품들이 존재하지만 쉐도잉을 하는 작품들은 대부분 비슷한 경우가 많다. 블로그, 유튜브 등의 추천 글과 영상을 봐도 비슷한 작품들을 추천하기 때문이다.
  • 사용자는 다양한 작품으로 영어 공부를 하고 싶을 때 작품을 선택할 수 있는 기준이 필요하다.
가설 설정
  • 어렵다고 생각되는 작품들은 사용되는 단어들이 어려운 단어가 많을 것이다.
  • 기준 영단어들의 레벨을 설정하고 단어 비교를 통해서 작품의 난이도를 설정할 수 있을 것이다.

엘리스에서 배운 데이터분석 기술, 알고리즘 및 라이브러리 사용 계획

  • 데이터 분석 기술을 이용하여 데이터 전처리를 사용할 예정
  • 기준 영단어와 대본 단어 데이터를 비교하기 위해 데이터분석 기술을 사용할 예정 (아직 구체적이지는 않음)

데이터 분석 종류 (시각화, 통계 대시보드 등)화, 통계 대시보드 등)

  • 작품별, 장르별 영어 난이도 분포

3. 프로젝트 기능 설명

메인 기능

  1. 사용자의 영어 레벨을 판단할 수 있는 진단 기능
  2. 작품을 대본 데이터를 기준으로 레벨을 판단하고 유저의 레벨에 맞게 추천하는 기능

서브 기능

  1. 작품의 기본 정보, 해당 작품의 난이도의 단어들로 예문 보여주기 (작품에서 쓰인 대사), 작품에서 사용된 대사로 퀴즈 풀기
  2. 작품들의 랭킹을 필터(장르별, 제목별, 영어 난이도별, 등) 처리 후 보여주기
  3. 단어를 검색하면 관련된 예문과 영화를 보여줌
  4. 대본(자막)을 업로드 하면 사용된 단어들의 레벨 분포를 보여줌

사용자가 얻는 인사이트

  1. 사용자의 영어 레벨에 맞는 작품을 찾을 수 있음
  2. 작품의 영어 레벨을 선택 기준으로 사용할 수 있음

4. 프로젝트 구성도

5. 프로젝트 팀원 역할 분담

이름 역할
공통 데이터 분석
김한별 백엔드
나석균 백엔드, 프론트엔드
남경민 프론트엔드
이승환 프론트엔드
정율리 벡엔드



📖 More Information...

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Jupyter Notebook 94.1%
  • Python 3.2%
  • JavaScript 2.3%
  • CSS 0.4%
  • HTML 0.0%
  • Mako 0.0%