EDA 3

[논문 요약] EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks

논문 링크 : EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks We present EDA: easy data augmentation techniques for boosting performance on text classification tasks. EDA consists of four simple but powerful operations: synonym replacement, random insertion, random swap, and random deletion. On five text classificati arxiv.org 코드 링크 : GitHub - jasonwei20/ed..

Data/논문 읽기 2022.11.17

[학습 일지 / day 30] 와 30일!

일지를 쓴지도 이제 30일이 되었네 한달은 이미 훌쩍 넘긴 거겠지 프로젝트가 공개되고 많은 일들이 있었다. 새벽까지 Eda 작업을 하기도 했고 Data를 보느라 지쳐 쓰러질? 뻔한 적도 있었다. 그 외적으로는 GPT-1 논문을 공부하고 또 수업 내용을 꼼꼼히 듣고자 노력하였다. 아무래도 주어진 과제가 있다보니 그 외의 것들에 집중하는 것이 평소보다는 어렵게 느껴졌다. 오늘은 데이터 시각화 수업 못 들은 부분들이 있어서 그것을 마저 들었다. 사실 데이터 보면서 같이 듣느라 엄청 주의 깊게 듣지는 못했다. 급한 일은 아니니까 일단 넘기고 후에 여유가 된다면 아마 부스트 캠프 끝나고 유예기간? 동안에 듣지 않을까 싶다. 데이터를 보여주는 일이 경시되는 것에 비해서는 매우 중요한 일이라고 생각한다. 오늘은 데이..

[학습 일지 / day 26] 다사다난

오늘은 온몸이 뻐근하게 시작한 하루였다. 주말 간 한일도 많았고 앞으로 할일도 많은 그런 하루의 시작이었다. diffusion study 정리하고 level1 프로젝트 준비하고 팀업과 같은 사전 사항을 챙기고 level2 프로젝트 사전 조사하고 또 개인사나 일정도 미리미리 정리하며 바쁘게 하루를 보냈다. 강의도 듣고 또 이전의 자료를 정리하고 심화 과제를 다시 보기도 하였지. 심화 과제 다 못본 게 항상 머릿속 어딘가에 남아있는 것 같다. 계속 탭 창 띄워놓고 하나씩 느리지만 해나가고 있다. 그리고 팀원들과 피어섹션 시간에 프로젝트에 관해 개괄적인 얘기를 나누기도 했다. 그런데 더 못할 줄 알았는데 뭐랄까 이거 해버렸다. 프로젝트 EDA... 잠깐 산책 나갔다가 해보면 재밌겠는데 했는데 막상 해보니 이거..