본문 바로가기

전체 글97

[3조] 자연어처리 1~4주차 보고서 자연어 처리란? 자연어 처리(NLP)는 인간의 언어를 해석, 조작 및 이해하는 능력을 컴퓨터에 부여하는 기계 학습 기술입니다. 텍스트 데이터는 인류가 생겨난 이후로 가장 많이 쌓여있는 데이터라고 볼 수 있습니다. 자연어 처리에는 많은 분야(추천시스템, 기계 번역 등)가 있는데, 제가 소개해드릴 분야는 토픽모델링과 관련된 사회과학 분야의 예시입니다.  https://github.com/d0gyunkim/first_project  해당 링크는 제가 직접 시도한 토픽 모델링 프로젝트입니다. 국민 청원 데이터를 사용하였고, 자연어 처리 , 그중에서도 토픽 모델링을 사용한 청원 잠재 주제를 선정하였습니다. 이후에 해당 주제들을 네이버에 검색한뒤, 이에 대한 기사수, 댓글수, 감정 표현수를 수집하여 이를 온라인에서.. 2024. 11. 4.
[1조] 자연어 처리 1주차-4주차 보고서 [RNN]1. RNN의 개요Recurrent Neural Network(RNN)는 순환 구조를 가지는 딥러닝 모델로, 현재 타임스텝의 예측값을 이전 타임스텝의 정보에 기반하여 산출한다. RNN은 매 타임스텝마다 동일한 파라미터를 가진 모듈을 반복적으로 호출하여 이전의 상태 정보를 계속 이어가는 '재귀적인 호출' 방식을 따르기 때문에 '순환 신경망'이라고 한다.  2. RNN 계산법RNN의 학습과 예측은 시간 축에 따라 단계적으로 진행된다. 이 과정에서는 각 타임스텝 t에 대해 입력 벡터, 이전 hidden state, 새로운 hidden state, 출력 벡터가 모두 계산에 활용된다.x_t​ : 현재 타임스텝 t의 입력 벡터이다.h_{t-1}​ : 이전 타임스텝 t−1의 hidden state 벡터이다... 2024. 11. 3.
[3기 자율 주제 프로젝트] 서울시 젠트리피케이션 문제 분석 및 기대효과 Team 건고소도 류건희 고정윤 소정인 도소연- 프로젝트 주제 소개 및 선정 배경젠트리피케이션이란 도심 인근의 낙후지역이 활성화되면서 외부인과 돈이 유입되고, 임대료 상승 등으로 원주민이 밀려나는 현상이다. 성수동은 팝업 성지라고 불릴정도로  다양한 팝업스토어가 열리고 있다.    하지만, 옆의 기사에서 보이다시피    팝업스토어로 인해 기존 상인들이     가파른 임대료 상승을 감당하지        못하고 떠나고 있다는 우려가 나오고 있다. 이는 젠트리피케이션 현상의    대표적인 문제다.현재 성수동 외에도 홍대, 이태원등에서 젠트리피케이션이 빠르게 진행되고 있다. 이로 인해 임대료 상승과 상권 재편으로 기존 주민과 소상공인들이 경제적 부담을 느끼고, 사회적/경제적 불균형이 심화되며, 지역의 문화적 정.. 2024. 10. 29.
[3기 자율 주제 프로젝트] 공공야간약국의 효과적 배치를 위한 데이터 기반 분석 team 2프로젝트 주제 및 선정 배경공공 심야 약국이란 일반적으로 심야 시간대에도 의약품을 구매할 수 있는 약국을 의미합니다. 공공 심야 약국은 특히 심야 시간에 발생하는 응급 상황에서 시민들이 필수적인 의약품을 구입할 수 있도록 도움을 주는 중요한 공공 서비스입니다. 이는 응급실 방문을 줄이고, 응급 상황에서의 신속한 대처를 가능하게 하여 시민 건강과 안전에 기여하는 역할을 합니다.현재 서울시에는 일부 심야 약국이 운영되고 있지만, 이들의 위치와 운영 시간은 일정하지 않거나 제한적이어서 실질적으로 시민들이 긴급한 상황에서 필요한 의약품을 쉽게 구할 수 없는 경우가 발생하고 있습니다. 예를 들어, 야간에 아동이 열이 나는 경우나 고령자가 갑작스럽게 필요한 약품을 구할 수 없는 경우 응급실 방문으로 이어.. 2024. 10. 6.