본문 바로가기

전체 글97

Code 데이터 시각화 프로젝트 #1 분석할 주제 대부분은 대학교에 들어오면서 가격이 천차만별인 노트북 중 하나를 구매했을 것이다. 노트북은 다양한 부품들의 결합에 따라 가격이 좌우되는데, 우리 조는 특히 어떠한 부품이 가격형성에 주요한 영향을 주는지 분석하기로 했다. 프로세서명, ram의 용량&종류와 노트북 가격의 상관관계를 각각의 그래프를 통해 알아보기로 하였으며, 대표로 프로세서명과 가격의 상관관계를 분석한 코드를 티스토리에 정리해 보았다. 1. 글씨체 다운로드 한글 폰트를 출력하기 위해 사용자가 별도로 설치해야 한다. 이 블록을 실행한 후 런타임을 재시작한다. 2. 구글 드라이브 연동 드라이브에 저장된 파일을 시각화할 것이기에, 드라이브와 연동하는 과정을 거침으로써 해당 파일을 불러온다. .mount() 함수를 사용하여 다른 파일 시.. 2023. 5. 29.
Code Reading #1 1. import matplotlib.pyplot as plt: 그래프 그리기를 위한 matplotlib의 pyplot 모듈을 불러오고, 이를 plt로 지정합니다. plt.rc('font', family='NanumBarunGothic'): plt의 글꼴을 'NanumBarunGothic'으로 설정합니다. 이는 한글 글꼴을 지정하는 것으로, 한글이 깨지는 것을 방지합니다. plt.rcParams['axes.unicode_minus'] = False: plt의 글꼴에서 유니코드 마이너스 기호를 제거합니다. 이는 한글이 깨지는 것을 방지합니다. from matplotlib import font_manager, rc: matplotlib의 글꼴 관련 모듈을 불러옵니다. covid19_raw = pd.read_.. 2023. 5. 15.
Code Reading #5 5조 코드 리딩 순서 코드 메소드 코드 목적 코드 결과 느낀점/의문점 예시 분석 코드 메소드 1. 구글 드라이브 연동 Google Colab을 활용해서 구글 드라이브에 있는 데이터에 접근할 수 있습니다. 이를 위해선, 구글 드라이브를 마운트하고, Colab에서 /content/drive 경로를 통해 파일에 접근합니다. 2. 데이터 불러오기 및 전처리 데이터 처리와 분석에는 주로 pandas, numpy, matplotlib 등의 모듈을 사용합니다. pandas는 데이터를 처리하고 분석하는 데 사용되는 엑셀 같은 도구이며, numpy는 선형대수학 문제를 다루는 도구입니다. matplotlib는 데이터를 그래프로 시각화하는 도구입니다. 이러한 모듈들을 사용하여 데이터를 불러오고, 전처리를 진행합니다. 데이터.. 2023. 5. 15.
Kaggle competiton #1 : Titanic survivor predictions 컴페티션 목표 : 머신러닝을 이용하여 타이타닉 승객들의 생존 여부를 예측 Survived 정보를 담은 csv파일을 제출하여 정답과의 일치율을 확인 작성자 : 김소륜 작성일 : 2023-03-31 파트 : 전처리 - sex - embarked - Pcalss # data analysis and wrangling import pandas as pd import numpy as np import random as rnd # visualization import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline # machine learning from sklearn.linear_model import LogisticRegression from.. 2023. 4. 12.