본문 바로가기

CODE94

[2조] 자연어처리 강의 1~4주차 정리 보고서 기존의 자연어 처리 기법Bag-of Words-딥러닝 기술이 적용되기 이전 많이 사용되던 기법으로, 문장 내 단어들을 하나의 원소로 이해하여 정리하는 방법이다.-워드별로 가방을 준비하고, 특정 문장에서의 워드들을 순차적으로 해당하는 가방에 넣어준 후, 각 가방들의 워드의 수를 세서 벡터로 나타낸 것이라고 보면 된다.-Bag of Words는 NaiveBayes Classifier로 정리할 수 있다. Bag-of Words에 필요한 사전 정리, One-hot 벡터 -카테고리들을 one-hot 벡터로 정리 -단어가 3개면 3개의 one hot 벡터로 정의하며, 모든 단어가 동일한 관계로 이루어진다. Bag-of Words 예시'CODE is Good Good' One-hot vectors: CODE=[1 0.. 2024. 11. 4.
[3조] 자연어처리 1~4주차 보고서 자연어 처리란? 자연어 처리(NLP)는 인간의 언어를 해석, 조작 및 이해하는 능력을 컴퓨터에 부여하는 기계 학습 기술입니다. 텍스트 데이터는 인류가 생겨난 이후로 가장 많이 쌓여있는 데이터라고 볼 수 있습니다. 자연어 처리에는 많은 분야(추천시스템, 기계 번역 등)가 있는데, 제가 소개해드릴 분야는 토픽모델링과 관련된 사회과학 분야의 예시입니다.  https://github.com/d0gyunkim/first_project  해당 링크는 제가 직접 시도한 토픽 모델링 프로젝트입니다. 국민 청원 데이터를 사용하였고, 자연어 처리 , 그중에서도 토픽 모델링을 사용한 청원 잠재 주제를 선정하였습니다. 이후에 해당 주제들을 네이버에 검색한뒤, 이에 대한 기사수, 댓글수, 감정 표현수를 수집하여 이를 온라인에서.. 2024. 11. 4.
[1조] 자연어 처리 1주차-4주차 보고서 [RNN]1. RNN의 개요Recurrent Neural Network(RNN)는 순환 구조를 가지는 딥러닝 모델로, 현재 타임스텝의 예측값을 이전 타임스텝의 정보에 기반하여 산출한다. RNN은 매 타임스텝마다 동일한 파라미터를 가진 모듈을 반복적으로 호출하여 이전의 상태 정보를 계속 이어가는 '재귀적인 호출' 방식을 따르기 때문에 '순환 신경망'이라고 한다.  2. RNN 계산법RNN의 학습과 예측은 시간 축에 따라 단계적으로 진행된다. 이 과정에서는 각 타임스텝 t에 대해 입력 벡터, 이전 hidden state, 새로운 hidden state, 출력 벡터가 모두 계산에 활용된다.x_t​ : 현재 타임스텝 t의 입력 벡터이다.h_{t-1}​ : 이전 타임스텝 t−1의 hidden state 벡터이다... 2024. 11. 3.
[3기 자율 주제 프로젝트] 서울시 젠트리피케이션 문제 분석 및 기대효과 Team 건고소도 류건희 고정윤 소정인 도소연- 프로젝트 주제 소개 및 선정 배경젠트리피케이션이란 도심 인근의 낙후지역이 활성화되면서 외부인과 돈이 유입되고, 임대료 상승 등으로 원주민이 밀려나는 현상이다. 성수동은 팝업 성지라고 불릴정도로  다양한 팝업스토어가 열리고 있다.    하지만, 옆의 기사에서 보이다시피    팝업스토어로 인해 기존 상인들이     가파른 임대료 상승을 감당하지        못하고 떠나고 있다는 우려가 나오고 있다. 이는 젠트리피케이션 현상의    대표적인 문제다.현재 성수동 외에도 홍대, 이태원등에서 젠트리피케이션이 빠르게 진행되고 있다. 이로 인해 임대료 상승과 상권 재편으로 기존 주민과 소상공인들이 경제적 부담을 느끼고, 사회적/경제적 불균형이 심화되며, 지역의 문화적 정.. 2024. 10. 29.