본문 바로가기

Project4

CODE 데이터 시각화 프로젝트 #5 주제 빅데이터응용학과 재학생들이 졸업 후 나아가게 될 진로 중 가장 많은 학생들이 선택할 데이터 사이언스 분야의 세부 직종별 급여의 수준에 대해 조사해보고, 시각화해보며 직종과 급여의 상관관계에 대해서 알아보기로 했다. 데이터 사이언스 분야에서도 꽤 세분화된 직종이 있으며, 직종에 따라 급여 차이의 폭이 얼마나 큰지도 조사해보고 결과를 도출하였다. 1. 글씨체 다운로드 시각화된 그래프에 출력할 폰트를 설치하고, 런타임을 재시작해준다. 2. 구글 드라이브 연동 시각화할 파일을 드라이브에서 python으로 불러오기 위해 구글 드라이브와 연동시킬 수 있는 함수를 만들어준다. 3. 데이터 불러오기, 전처리 구글 드라이브와 연동하여 불러온 파일을 열기 위해서는 파일 안의 데이터를 불러오고, 전처리하는 과정을 거쳐.. 2023. 5. 30.
CODE 데이터 시각화 프로젝트 #6 주제 회기역 시간별 지하철 인원 분석 통학을 하는 대부분의 학생들 중 대다수가 학교를 올 때 지하철 1호선이나 경의중앙선을 이용하여 회기역에서 하차를 한다. 경희대학교 학생이라면 출퇴근시간과 오전 등교시간에 매우 혼잡한 회기역의 모습을 본 경험이 있을 것이다. 우리 조원들 중 4명 중 3명은 매일마다 편도 한 시간~두 시간이 걸리며 통학을 하는 "통학러"인 학생들로서, 매우 혼잡한 상태의 지하철과 회기역의 고단함을 누구보다 잘 아는 사람들이다. 우리는 월별, 호선별, 역별, 시간대별 승하차 인원 수가 나와있는 데이터 파일을 활용하여, 최근의 회기역의 시간대별 혼잡도를 한눈에 파악하고, 이러한 문제들과 학생들의 불편함을 해결할 수 있는 인사이트를 도출하려고 한다. 1. 글씨체 다운로드 !sudo apt-g.. 2023. 5. 29.
Code 데이터 시각화 프로젝트 #1 분석할 주제 대부분은 대학교에 들어오면서 가격이 천차만별인 노트북 중 하나를 구매했을 것이다. 노트북은 다양한 부품들의 결합에 따라 가격이 좌우되는데, 우리 조는 특히 어떠한 부품이 가격형성에 주요한 영향을 주는지 분석하기로 했다. 프로세서명, ram의 용량&종류와 노트북 가격의 상관관계를 각각의 그래프를 통해 알아보기로 하였으며, 대표로 프로세서명과 가격의 상관관계를 분석한 코드를 티스토리에 정리해 보았다. 1. 글씨체 다운로드 한글 폰트를 출력하기 위해 사용자가 별도로 설치해야 한다. 이 블록을 실행한 후 런타임을 재시작한다. 2. 구글 드라이브 연동 드라이브에 저장된 파일을 시각화할 것이기에, 드라이브와 연동하는 과정을 거침으로써 해당 파일을 불러온다. .mount() 함수를 사용하여 다른 파일 시.. 2023. 5. 29.
Project : CODE1 안녕하세요, 함께 배우고, 함께 성장하는 CODE입니다! 이번 글에서는 CODE의 첫 번째 프로젝트인 Project : CODE1에 대해 소개해 드리겠습니다! Project : CODE1은 크게 두 단계로 구성됩니다. 1. 데이터 시각화에 필요한 파이썬 모듈 학습 2. 조별 데이터 시각화 프로젝트 1단계에서는 DataCamp라는 사이트에서 파이썬 모듈을 학습합니다. 위 두 가지 컨텐츠를 진행하였습니다. Introduction to Python : 1학기의 학습했던 파이썬의 기초 개념 복습 Intermediate Python : 데이터 시각화에 필요한 모듈 학습 1단계 완료 후, 조를 구성하여 본격적으로 데이터 시각화 프로젝트를 진행하였습니다. 서울 열린데이터 광장의 코로나 19와 관련 공공데이터를 활용하.. 2023. 2. 26.