-
네이버와 다음 뉴스의 경쟁 업체에 대한 뉴스 차이 양상 탐구
- 서로 경쟁업체인 네이버와 다음 뉴스를 같은 키워드를 검색했을 때 뉴스가 편향되어 있는 것은 아닌지에 대한 의문점에서 데이터 분석한 프로젝트입니다.
- 팀프로젝트(3명) / 조장으로 프로젝트 진행
- 검색 키워드 : 카카오 / 네이버
- 크롤링과 텍스트 마이닝을 통한 데이터 분석
- Github
뉴스키워드 크롤릴&텍스트마이닝 보고서.hwp
뉴스키워드 크롤링&텍스트마이닝.pdf
-
코로나19 - 한국은 과연 여전히 방역 강국인가
- 과연 작년 초 방역 강국이라고 했던 대한민국은 여전히 방역강국인가라는 의문에서 데이터 분석을 시작했습니다.
- 개인 프로젝트
- WHO에서 제공하고 있는 세계 코로나 현황 데이터와 백신 접종률 데이터를 활용
- EDA를 통해 선진국 중 5개의 나라별(미국,일본,인도,독일,한국) 코로나 사태를 비교
시계열을 활용하여 주기성과 예측까지 파악해보았습니다.
- Github
- Youtube 링크
코로나 바이러스 프로젝트.pdf
-
스타벅스와 이디야 - 두 커피숍은 어디에 많이있나? / 이디야는 일부러 스타벅스 주변에 있나?
- 스타벅스와 이디야는 어디 지역에 커피숍이 많을까?
이디야가 고의적으로 스타벅스 주변에 매장을 여는 것은 아닐까?
두가지 의문으로 데이터 분석을 시작했습니다.
- 개인 프로젝트
- Selenium와 BeautifulSoup을 활용해 두 커피숍의 특징을 데이터 분석하고
시각화 하여 커피숍들 간에 위치 파악을 해보았습니다.
- Github
-
NaverAPI를 활용해 인기 프로그래밍 언어 책들의 특징 데이터 분석
- NaverAPI를 활용해 인기 컴퓨터 언어들의 교육책들의 특징을 크롤링 후
데이터 분석을 했습니다.
- 개인 프로젝트
- TIOBE에서 발표한 컴퓨터 언어 순위 참고
- 인기 프로그래밍 별 출판사와 출판권수 연도별 출판권수를 함께 비교분석
특정 기간에 출판 되는 주기를 파악
- Github
-
Steam 게임 데이터 분석 - 스팀 속 많은 게임들 중 추천 게임 고르기
- Kaggle에 있는 Steam 게임들의 정보가 들어 있는 데이터 활용
- Data의 여러 컬럼들을 고려하고 Pandas를 활용해 게임 추천까지 진행해보았습니다.
steam데이터 분석.pdf