안녕하세요! 저희는 '우승은 어짜피 우리' 줄여서 '우어우' 입니다!
저희는 K-Beauty의 현황을 파악해보고 저희만의 가설을 설정해서 직접 검증해보도록 하겠습니다.
데이터 분석 방법과 결과
작성자 : 박준현, 고정윤
기본 가설 : K-beauty 는 성장하고 있을까?
우리는 위의 가설을 검증하기 위해 국가통계포털(KOSIS)에서 국가(대륙)별/상품군별 온라인쇼핑 해외직접판매액 통계자료를 다운받아 실제로 K-Beauty사업이 우상향 중인지 확인해보려 한다.
1. 데이터 로드 & 사전 세팅
우선 KOSIS 홈페이지에서 국가(대륙)별/상품군별 온라인쇼핑 해외직접판매액 자료를 다운받은 후
(2014~2019 자료 사용)
우리가 사용할 Google Colab에 마운트 시킨다.
그 후 시각화 과정에서 사용할 라이브러리를 import해줄 것이다.
matplotlib와 seaborn 라이브러리는 한글 폰트를 설정해주지 않는다면 그래프가 정상적으로 그려지지 않기에
따로 폰트를 설정해주도록하자.
(위의 코드를 작성했음에도 여전히 폰트가 깨진다면,
해당 셀 실행 -> 세션 다시시작 -> 모든 세션 시작. 순으로 한 번 실행해보자.)
2. 데이터 마운트
우선 통계 csv파일을 df_raw라는 변수에 담아주도록하자.
이 raw파일은 가공을 거치기 전의 아주 날 것의 데이터프레임이다.
이제 이 raw파일을 본격적으로 분석하기 전 전처리과정을 통해 데이터를 분석하기 쉽게 만들어 주겠다.
3. 데이터 전처리
melt() 함수 사용.
출처 : 나
우리가 시각화 하려는 자료는 x축을 연도로 둔 채 각각 기간별로 판매량을 y축에 나타내어
전체적인 그래프 추이를 보기 위한 것이다. (위의 그래프 참고)
이때 우리는 각각의 row를 해당 년도의 매출액과 년도로 설정하는것이 시각화에서 더욱 직관적일 것이다.
-> 각각 row가 하나의 요소가 되기에
따라서 그래프를 그리기 전 우리는 columns 이었던 년도와 분기 (20XX.X/4)를 row로 옮겨주도록 하자.
그 다음으로 더 세부적인 그래프 작성을 위해 작성한 df에서 년도, 분기를 분리해서
새로운 column을 추가하자.
연도&분기 분리
현재 '기간' column을 불러와준 후 어느 곳을 기준으로 split을 해줄 지 결정한다.
'기간' column을 기준으로 *map()함수를 써준다.
*이때 map()함수란 map(함수이름, 리스트) 형식으로 쓰이며
'함수이름'에 해당하는 함수를 리스트의 각 인덱스에 순서대로 적용시키는 함수이다.
for문과 비슷한 역할을 한다고 볼 수 있다.
또한 lambda함수를 사용하여 바로 함수를 정의해주었다.
위의 함수를 사용하여 df에 새로운 column을 만들어 주었다.
이때 마찬가지로 '분기' column도 생성해주었다.
이때 split()함수는 문자열이라면 얼마든지 사용해줄 수 있기에, 위와 같이 연속으로 사용해주는 것도 가능하다.
또한 오류 방지를 위해 1을 문자열이 아닌 int형으로 변환해주었다.
결측치 NaN값으로 변환해주기.
기본 df데이터 프레임에서 결측치는 '-'로 나타나 있었다.
이를 numpy에서 결측치를 뜻하는 NaN으로 바꾸기 위해 replace()함수를 사용하였다.
통일성을 위해 astype()을 통해 float형으로 변환
그냥 함수만 사용하는 것은 새로운 선언이 되는 것은 아니기에,
'백만원'이라는 column에 새로이 선언 해주도록 한다.
국가대륙별 합계 & 상품군별 합계 제거
우리는 가설 검증을 위해 각각의 상품군별 데이터 & 국가(대륙)별 데이터를 시각화 하고 싶은 것 이기에
'합계'는 불필요한 데이터이다.
따라서 '합계'가 포함된 row를 삭제시켜 주겠다.
'합계'를 제외시킨 후 df에 선언 시켜주었다.
NaN 결측치 데이터 제외
이때 결측치가 있다면 그래프로 시각화 할 때 불편하기에 NaN이 포함된 row를 제거해준다. (즉 판매유형별 column에서 '계'만 남겨두는 것)
이제 데이터를 시각화 하기 전 전 처리가 모두 완료되었다.
본격적으로 seaborn, matplotlib을 통해 그래프를 그려보도록 하자.
4. 전체 데이터 시각화
seaborn을 통해 가장 기본적인 그래프인 선 그래프를 그려주도록 하자.
위의 그래프는 모든 판매량의 평균값을 그린 데이터이다. 상품군별로 색을 다르게 해서 다시 그려보자.
hue를 사용해 색깔별로 상품군별을 다르게 보았다.
위의 그래프는 한 번에 너무 많은 정보가 탑재되어있기에 각각의 그래프를 상품군별로 분리해주자.
col_wrap을 통해 한 줄에 몇개의 그래프를 둘 것인지 정해줄 수 있다.
이때 '화장품'과 '의류 및 패션 관련상품' 의 판매금액이 너무나 크게 나타나,
다른 그래프들의 요소들이 정확히 보이지 않는다.
따라서 더 자세한 획인을 위해 이 두 항목을 제외하고 그래프를 다시 생성해보자.
두 항목을 제외한 그래프는 6번에서 볼 수 있다.
5. 화장품 항목 판매금액 추이 시각화
화장품 데이터를 가져온다.
df_cosmetic이라는 변수 값에 저장한다.
어떤 값이 들어있는지 unique() 로 확인하면 화장품만 있는 것을 확인할 수 있다.
앞서 말한 sns.lineplot을 사용하여 시각화 그래프를 그려보겠다.
가로축 기준으로 2019년까지 판매액이 증가하다가 이후 하락세를 보이는 것을 알 수 있다.
이제 분기별로 살펴보자.
앞서 보았던 연도별 그래프와 같이 분기별로도 2019년까지 판매액이 증가하다가 이후 하락세를 보이는 것을 알 수 있다.
기간별 화장품 판매액 데이터 시각화
이번에는 연도가 아닌 기간으로 그래프를 그려보겠다.
앞서 보았던 것과 같이 판매액이 증가추세를 이루다가 감소하는 것을 볼 수 있다.
여기서 plt.xtick는 아래 기간부분 글씨가 겹치지 않게 하기 위해 글자를 회전시키는 기능이다.
화장품 데이터프레임을 지역별로 출력을 해보겠다.
주황색 선인 중국에서의 판매액이 가장 높게 나타나는 것을 확인할 수 있다.
중국 다음으로 일본이 높게 나타난다.
중국에서의 판매액이 워낙 높다보니 다른 지역에서의 그래프가 잘 나타나지 않는다.
중국을 제외하고 출력해보면
일본이 다음으로 가장 높다는 것을 다시 한 번 확인할 수 있다.
또한, 다른 지역들의 화장품 판매액도 좀 전보다 뚜렷하게 나타나게 되었다.
다음으로 기간 별로 시각화를 해보자.
2019년 4분기에 최고점을 찍고 하락하는 추세를 보여준다.
온라인 면세점 이외의 판매액 수치를 보아도 마찬가지인 것을 확인할 수 있다.
의류 및 패션 관련 상품의 판매액 시각화
df_fashion = df[df["상품군별"] == "의류 및 패션관련 상품"].copy()
df_fashion.head()
의류 데이터만 df_fashion이라는 변수에 넣겠다.
df_fashion = df[(df["상품군별"] == "의류 및 패션관련 상품") & (df["판매유형별"] == "계")].copy()
df_fashion.head()
이후 판매유형별이 '계'인 데이터를 df_fashion에 넣었다.
의류 패션 부분에서는
2019년까지는 화장품과 마찬가지고 중국에서의 판매액이 가장 높지만 그 이후 일본이 더 앞서나갔다는 것을 알 수 있다.
판매유형별로도 확인하였을 때 면세점 이외에서는 계속 높은 수치를 보여주지만
2019년 이후 면세점 판매액이 훅 감소하였다는 사실을 확인할 수 있다.
pivot_table 열을 "지역별", 행을 "연도"로 지정했다.
aggfunc = "sum"으로 설정하여 합계값을 알아본다.
이후 result라는 변수에 이 데이터를 저장한다.
heatmap으로 result값을 출력해보자.
sns.heatmap은 Seaborn 라이브러리에서 제공하는 함수로, 데이터의 값을 색상으로 표현하여 시각적으로 비교할 수 있는 히트맵을 생성한다.
주로 2차원 데이터(예: 피벗 테이블)에서 각 값의 크기를 시각적으로 나타내는 데 사용된다.
cmap 옵션을 사용하여 히트맵의 색상을 변경해보았다.
개인적으로 이게 더 맘에든다.
annot 옵션을 사용하면 수치를 표시해준다.
fmt 옵션으로 소숫점 없이 float형의 숫자를 나타낼 수 있다.
숫자를 보았을 때 중국에서의 구매액이 가장 높고 일본과 미국에서도 높다는 것을 확인할 수 있다.
6. 화장품 제외한 항목 판매금액 추이 시각화
만약 하나의 상품군만을 제외한다면 !=연산자를 통해 간단하게 제거해줄 수 있지만
화장품과 의류 및 패션 관련상품 모두를 제외시켜 주어야 하기에,
*isin() 함수와 '~'를 이용해 위와 같이 코드를 입력해주자.
이를 df_sub이라는 새로운 변수에 담아준 후 시각화를 진행하자.
이때 copy()함수를 사용해주어야, df_total의 내용이 바뀌어도 df_sub는 간섭받지 않고 그대로 유지될 수 있다.
*isin() 함수는 파라미터의 항목만을 출력해주는 함수이다. 이를 여집합을 표시하는 '~'와 함께 쓰인다면, isin() 매개변수를 제외한 데이터프레임을 손 쉽게 만들어 줄 수 있다.
화장품, 의류 및 패션 관련상품 다음으로는 가전.전자.통신기기 항목이 다음으로 높은 것을 볼 수 있다.
가설 : K-beauty 는 성장하고 있을까?
는 코로나 전후를 기점으로 하여 틀린가설이라는 것을 알수있다
이젠 본격적으로 K-Beauty의 성장세를 보기위해 '화장품' 항목의 그래프를 그려보도록 하겠다.
현황 파악 및 가설 설정하기
작성자 : 인시환
다음은 전체 화장품 판매액 그래프와 이를 지역별로 나누어 시각화한 그래프이다.
이를 보았을 때, 전체 화장품 판매에서 중국의 비중이 지배적이며 중국 판매액 변화에 따라 전체 판매액이 좌지우지됨을 알 수 있다.
그렇다면 중국을 중심으로 화장품 판매액의 변화 추이를 분석해보자.
- 2017년도 1분기 하락 요인
사드(THAAD)는 고고도 미사일 방어 체계로, 북한의 미사일 위협에 대응하기 위해 미국과 한국이 협력하여 도입한 방어 시스템이다. 그러나 이로 인해 중국과의 외교적 갈등이 발생하였다. 중국 정부는 사드 배치에 강력히 반발하며 경제적 보복 조치를 취하였다.
이러한 경제적 보복 조치 중 하나는 바로 한국 제품에 대한 비공식적인 수입 규제였다. 특히 K-Beauty 산업은 중국 내에서 큰 인기를 끌고 있었기 때문에, 중국의 규제는 K-Beauty 제품의 수출에 큰 영향을 미쳤다.
2017년 1분기, K-Beauty 산업의 수출은 크게 감소하였다. 한국무역협회에 따르면, 2017년 1분기 한국 화장품 수출액은 전년 동기 대비 약 20% 감소하였다. 이는 중국이 한국 화장품에 대한 비관세 장벽을 높이고, 한국 기업에 대한 검사와 통관 절차를 강화한 결과로 분석된다.
또한, 사드 배치 이후 중국 내 한국 화장품의 소비 심리가 크게 위축되었다. 많은 중국 소비자들은 애국주의적 소비 성향을 보이며 한국 제품 대신 자국 제품을 선택하였다. 이로 인해 한국 화장품의 매출이 급감하였다.
뿐만 아니라, 중국 내 주요 유통 채널인 온라인 플랫폼과 오프라인 매장에서도 한국 화장품의 판매가 줄어들었다. 중국의 대표적인 온라인 쇼핑몰인 타오바오와 티몰 등에서는 한국 화장품의 노출이 감소하였고, 오프라인 매장에서는 한국 제품의 진열이 줄어드는 등 다양한 제한 조치가 시행되었다.
- 2020년도 1분기 하락 요인
2020년 초, 코로나19의 확산을 막기 위해 각국은 국경을 봉쇄하고 이동을 제한하는 조치를 취하였다. 이러한 조치는 물류와 공급망에 큰 차질을 빚게 하였고, 한국 화장품의 주요 수출 시장인 중국, 미국, 유럽 등지로의 수출이 급감하였다.
한국무역협회에 따르면, 2020년 1분기 한국 화장품 수출액은 전년 동기 대비 약 10% 감소하였다. 이는 코로나19로 인한 국제 물류의 제한과 소비 심리 위축이 주요 원인으로 분석된다. 특히, 비대면 활동이 증가하면서 화장품 소비가 줄어들었고, 이는 한국 화장품 수출 감소로 이어졌다.
또한, 코로나19로 인해 각국의 경제 상황이 악화되면서 소비자들의 구매력이 감소하였다. 많은 소비자들이 생필품 위주의 소비를 하게 되었고, 이는 화장품과 같은 비필수 소비재의 수요 감소로 이어졌다. 이에 따라 한국 화장품의 해외 판매량도 크게 줄어들었다.
코로나19로 인한 여행 제한도 한국 화장품 수출 감소에 큰 영향을 미쳤다. 한국 화장품은 그동안 중국과 동남아시아 지역에서 관광객들을 통해 많은 수출이 이루어져 왔다. 그러나 코로나19로 인해 관광 산업이 침체되면서 이러한 수출 경로가 차단되었다.
- 2020년도 2분기 상승 요인
코로나19의 확산을 막기 위해 전 세계적으로 손 씻기와 소독의 중요성이 강조되었다. 이에 따라 손 세정제, 마스크, 소독제 등 방역 용품에 대한 수요가 폭발적으로 증가하였다. 한국은 우수한 제조 능력과 높은 품질로 인해 방역 용품의 주요 공급국으로 부상하였다.
한국무역협회에 따르면, 2020년 1분기 한국의 손 세정제 수출액은 전년 동기 대비 300% 이상 증가하였다. 이는 코로나19의 확산으로 인해 전 세계적으로 손 세정제에 대한 수요가 급증한 결과이다. 특히, 미국, 유럽, 동남아시아 등에서 한국산 손 세정제의 인기가 높았다.
- 2020년도 4분기 이후 지속적인 하락세
지금까지 발생한 여러 사회적 사건을 바탕으로 현재 왜 K-Beauty가 지속적인 하락세에 빠져있는지 알아보고자 한다.
- 가설 1) K-Beauty의 하락 요인은 코로나의 영향이 지배적이다.
- 가설 2) 중국의 높은 의존도 때문에 K-Beauty가 흔들렸을 것이다.
가설 검증하기
작성자 : 박무준
- 가설 1) K-Beauty의 하락 요인은 코로나의 영향이 지배적이다.
틀리다. 코로나의 영향이 지배적이라 했으면 코로나 규제 완화가 된 2023년 시점부터 증가하는 모습이 보여야했을 것이다. 하지만, 2023년과 2024년 1분기가 중국이 K-Beauty에 본격적으로 관심 갖게된 2014-2015년정도 수준밖에 되지 않아 코로나 이후 중국에 새로운 패러다임이 생겼을 것이라 추측해볼 수 있다. 코로나가 K-Beauty 산업의 하락에 영향을 미칠 수는 있어도 대표적인 요인으로 뽑기엔 부족하다.
- 가설 2) 중국의 높은 의존도 때문에 K-Beauty가 흔들렸을 것이다.
맞다. 14-15년부터 중국이 K-Beauty 화장품에 관심을 갖게 되면서 K-Beauty 상품은 수출중심의산업으로 돌아가게 되었으며 중국 의존도가 몹시 높은 양상을 보이고 있다.
삼일 pwC경영연구원이 발표한 "K-Beauty 산업의 변화"라는 보고서에 의하면 중국시장에서 2019년 이후부터 성장률이 둔화되었다고 알 수 있다. 이는 중국 내에서 자국 상품을 긍정적으로 보는 시선과 코로나로 인해 수출이 원활하지 못한 상황이 겹친 결과라고 추측해볼 수 있다.
문제현황
한국인들은 C-Beauty에 대해 거의 들어본 적이 없을 것이다.
중국은 Z세대, C-Beauty, 소셜마케팅 이 3가지를 내세워 K-Beauty에 대적하고 있다.
중국의 화장품은 본래 '퀄리티가 떨어진다' 가 가장 큰 이유로 중국 내 소비자마저 꺼리던 것이었다. 2019년부터 중국의 화장품이 한국의 화장품을 거의 비슷한 정도로 베끼고 가격까지 싸게 하면서 C-Beauty의 부흥기를 열기 시작했다. 실제로 중국 IT업체 텐센트가 2019년 5월 발표한 '2019 C뷰티 보고서'에 따르면 중국 화장품 시장에서 C뷰티 시장점유율은 56%로 절반을 넘겼다. 또한 C-Beauty가 한국으로 역수출격으로 값싼 가격으로 들어오면서 한국시장에서도 큰 영향력을 미칠 것이라는 전망도 있다.
해결하기
작성자 : 박무준
"지금까지 발생한 여러 사회적 사건을 바탕으로 현재 왜 K-Beauty가 지속적인 하락세에 빠져있는지 알아보고자 한다." 라는 문제의 가장 큰 이유는 "C-Beauty"였다.
그렇다면 K-Beauty가 지속적인 하락세에서 벗어나 다시 상승 도약을 하려면 어떻게 해야할까?
우리가 C-Beauty에 관심을 가져야만 하는 이유는 중국과 한국 내의 수입 수출뿐만이 아니다.
현재 중국과 비슷한 정도하며 세상에서 가장 큰 규모의 시장을 가진 미국과 세계3위 시장인 일본시장이 K-Beauty에 관심을 본격적으로 관심을 갖기 시작했다는 것이다.
다만, K-Beauty 산업을 확실한 발전없이 그대로 간다면 결국에는 값이 싸다는 장점을 갖은 C-Beauty에 어쩔 수 없는 자본주의 시대에서 뒤쳐질 수밖에 없다는 것이다. 그렇다고 K-Beauty가 규모의 경제에 의해 중국보다 더 값싼 화장품을 수출하기란 중국 공장의 워낙 큰 규모 때문에 거의 불가능에 가깝다.
따라서 K-Beauty는 "양보다 질"에 초점을 맞춰야만 한다. 현재 한국과 중국의 소비자들을 봤을 때 근소한 질 측면에서의 우위보다는 확실한 가격 측면에서의 우위를 택하는 것을 볼 수 있다. 따라서 K-Beauty는 중국의 대량생산이 하지 못하는 퀄리티 부문에서 확실한 우위를 가져가야만 경쟁사회에서 살아남을 수 있을 것이다.
삼일pwC경영연구원들이 현재 2024 뷰티 산업 주요 트렌드로 발표한 6가지는 이와 같다.
결과적으로 우리 조가 생각한 K-Beuaty의 지속적인 하락 문제에 대한 해결점은 이와 같다.
미국과 일본이 온라인 구매량이 많다는 점을 이용해서 'Social Marketing'을 이용해서 한국의 퀄리티 높은 화장품들을 광고해야하며 'Smart Beauty' 초개인화 화장품을 통해 중국의 대량생산이 따라가기 힘든 부분을 공략해야 한다.
앞으로 기술력과 퀄리티를 앞세워 다시 도약할 K-Beauty의 미래가 기대하며 이 보고서를 마치겠다.
지금까지 읽어주셔서 감사합니다.
작성자 : 고정윤 박무준 박준현 인시환
'Study > CODE 3기 [파이썬으로 배우는 데이터 사이언스]' 카테고리의 다른 글
[최최최정예 1조:김이김이나] K-beauty 온라인 판매 전략 (0) | 2024.05.31 |
---|---|
[C5DE] 수도권/비수도권 간 의료 격차 알아보기 (1) | 2024.05.31 |
[불4조 - 코린이집] 서울 종합병원 분포 확인하기 (0) | 2024.05.29 |
[최최레최레최정예 1조:김이김이나] K-beauty 온라인 판매 전략 (0) | 2024.05.29 |
[4조:불사조] 건강검진데이터로 가설검정하기 (0) | 2024.05.28 |