데이터 엔지니어링 10일차 TIL

학습내용

데이터 시각화
데이터 시각화를 위해서 Matplotlib이나 Seaborn라이브러리를 사용한다.

Seaborn
라이브러리
import seaborn as sns
꺾은선 그래프(Line Plot)
sns.lineplot(x=[1, 3, 2, 4], y=[4, 3, 2, 1])

막대 그래프(Bar Plot)
sns.barplot(x=[1,2,3,4],y=[0.7,0.2,0.1,0.05])

Matplotlib
라이브러리
import matplotlib.pyplot as plt

제목추가
plt.title('제목')

라벨추가
x축 : plt.xlabel('라벨')
y축 : plt.ylabel('라벨')

그래프의 축의 범위 지정
x축 : plt.xlim(0,10) - x축 범위를 0~10으로 지정
y축 : plt.ylim(0,10) - y축 범위를 0~10으로 지정

그래프의 크기를 지정
plt.figure(figsize = (x,y)) 그래프의 크기를 (x,y)의 크기로 지정
그래프 함수 위에 써주어야 한다.

Word Cloud
자주 등장하는 텍스트를 중요도나 인기도를 고려해 표현한 것

1. 자연어 문장에서 키워드를 추출
2. 키워드가 등장한 빈도를 측정
3. 앞에서 전처리한 정보를 바탕으로 Wordcloud를 생성

느낀 점

시각화 부분에 대해서 배우고 싶었는데 이번 기회에 seaborn이나 matplotlib외에 내가 몰랐던 다른 시각화 방법들을 배울 수 있어 너무 좋았다.

아나콘다에서 java_home의 환경변수로 애를 먹으면서 환경변수 설정의 중요성을 알았다.

'데브코스' 카테고리의 다른 글

데이터 엔지니어링 12일차 TIL (0)	2024.04.09
데이터 엔지니어링 11일차 TIL (0)	2024.04.08
데이터 엔지니어링 9일차 TIL (0)	2024.04.04
데이터 엔지니어링 8일차 TIL (1)	2024.04.03
데이터 엔지니어링 7일차 TIL (0)	2024.04.02

주니어 데이터 엔지니어 우솨's 개발일지

데이터 엔지니어링 10일차 TIL

학습내용

'데브코스' 카테고리의 다른 글

티스토리툴바

데이터 엔지니어링 10일차 TIL

학습내용

'데브코스' 카테고리의 다른 글

관련글

티스토리툴바