분류 전체보기 914

[학습 일지 / day 59] 태깅과 오피스아워

오늘 주로 한 일은 태깅 작업이었다. 상위-하위 관계에 있는 엔티티라든지 아니면 문장 내에서 관계를 더 찾을 수 있다든지 하면 추가적으로 문장을 늘려주고 작업을 진행하였다. 이전 문장을 다시 보기도 해야했지만 이게 또 관계를 새로 찾으니까 관계가 또 많이 나와서 은근 할일이 많았다. 오후에는 최종 프로젝트 회의를 하였다. 이전에 아이디어 정리해둔 것이 있었는데 그것을 각자 리뷰한 이후에 모아서 의견을 나누었다. 최종 프로젝트 준비도 차근차근 나아가고 있어서 다행이라고 생각한다. 태깅 작업과 최종 프로젝트 관련한 논의들을 마친 후에는 깃 스터디를 진행하였다. 이번에는 내가 발표를 맡아서 clone, pull, push, merge, rebase 등에 대해 이야기를 나누고 전달하였다. 스터디가 끝난 후에 한..

[학습 일지 / day 58] 최종 프로젝트 설명회!

오늘은 팀원들과 오전에 간단하게 인사하고 파일럿 태깅 마무리한 부분에 대해 서로 의견을 나누고 의견을 통합하는 과정을 거쳤다. 파일럿 태깅과 본 태깅이 어느 순간부터 섞이게 된 기분이지만 뭐 괜찮겠지. 결국 중요한 건 의견을 합치는 과정을 거치고 좋은 결과물을 내는 것이다. 회의 이후에는 팀원이 준비한 깃 발표를 들었다. 팀 내에서 깃 활용이 부족했다는 평가가 많았고 다음 대회에서는 더 발전한 모습을 보이고자 이번 주 동안 깃 스터디를 하기로 하였다. 첫 스타트가 중요한데 잘 끊어줘서 고마웠다. 오후에는 최종 프로젝트에 대한 멘토님의 설명회? 팁들과 주의 사항 그리고 멘토님이 개인적으로 전하고 싶어하는 이야기를 별도의 시간을 통해 들었다. 최종 프로젝트를 어서 준비해야겠다는 생각도 들었지만 쉽게 접근해서..

[밑러닝 3] 제 2고지, 자연스러운 코드로 개념 정리

11. 가변 길이 인수(순전파 편) p106. 파이썬의 리스트와 튜플은 여러 개의 데이터를 한 줄로 저장합니다. 리스트는 [1,2,3]과 같이 []로 묶고 튜플은 (1,2,3)과 같이 ()로 묶습니다. 리스트와 튜플의 주요 차이는 원소를 변경할 수 있는지 여부입니다. 튜플의 경우 한 번 생성되면 원소를 변경할 수 없습니다. 예를 들어 x = (1, 2, 3)으로 튜플을 생성한 후에는 x[0] = 4 등으로 덮어 쓸 수 없는 것이죠. 반면 리스트는 원소를 변경할 수 있습니다. 12. 가변 길이 인수(개선 편) p110. 함수를 정의할 때 인수 앞에 별표(*)를 붙였습니다. 이렇게 하면 리스트를 사용하는 대신 임의 개수의 인수(가변 길이 인수)를 건네 함수를 호출할 수 있습니다. p112. self.forw..

Data/개념 정리 2022.12.10

[학습 일지 / day 57] 가이드 라인 제출

어제 오늘 Tagtog에서 파일럿 태깅을 진행한 후, 태깅한 내역들에 대해서 정리하여 팀원들과 공유하고 가이드라인과 Relation map을 어떻게 할지 논의하였다. Case Study에서 나온 내용들이 많았고 의견이 갈리는 부분들이 또 존재하였다. 데이터의 Concept과 관계를 정하는 작업과 Annotation을 지도하는 가이드라인을 만드는 작업 등이 생각보다 더 어려웠고 생각보다 더 신경 쓸 부분이 많은 작업이라는 것을 깨달았다. 피어세션 이후에는 멘토링을 받았다. Text to Image 생성 모델의 흐름에 대한 세미나를 진행하셨고 그 후에 멘토링 피드백에 대한 의견을 나누었다. 서로 생각을 맞춰가는 일은 어디에서든 필요한 것 같다. 멘토님께서 우리 의견을 반영하려고 노력해주셔서 감사했다. 쉬운 ..

[학습 일지 / day 56] 방향 조절

오늘은 데이터셋 프로젝트 회의와 또 최종 프로젝트 관련 회의 이렇게 두 개를 크게 진행하였다. 데이터셋 프로젝트 진행이 더뎠기 때문에 그 부분에서 할 얘기가 많았고 의견이 다른 부분이 많아 조율하는 데 시간을 또 들였다. 최근에는 회의 시간에 대해서 의견이 많이 갈리는 느낌이다. 회의 시간을 줄이는 것이 공통의 목표가 되었는데 그것을 지키는 것은 개인의 성향과도 연관된 문제라 쉽지만은 않은 것 같다. 그래도 해야지. 일단은 좋은 쪽으로 계속 대화하고 사고를 발전시켜 나가는 것이 내 목표이다. 어떤 결과를 받게 되든 상관 없는데 팀 내의 화합이 깨지는 것은 별로 보고 싶지 않다. 내일은 annotation 마무리 하고 또 데이터셋 프로젝트를 최대한 진행시켜봐야지. 앞으로 나아가는 것만 생각하자. 오늘도 수..

[학습 일지 / day 55] 대화

오늘은 팀 오프라인 미팅의 날이었다. 한 팀원의 모교에서 만나 스터디룸을 잡고 현재 진행 중인 데이터셋 프로젝트에 대해 얘기하고 또 이전 프로젝트에 대한 회고를 진행하였다. 데이터셋 프로젝트에 관해서도 많은 얘기가 오고 갔지만 정말 좋은 얘기가 오고 갔던 것은 프로젝트 회고였던 것 같다. 모두 아쉬웠던 점을 얘기하는 데서 그치지 않았고 그것들을 어떻게 개선하면 좋을지 고민하였고 그 내용들을 공유하면서 서로의 생각을 맞춰나갔다. 물론 프로젝트를 잘하고 또 잘 마무리 짓는 것도 중요하겠지만 이런 대화로부터 얻는 것이 사실 더 많지 않을까 생각이 들었다. 기술은 알아서 발전하는 거지만 사람은 꼭 그런 것이 아니니까 함께 하기 위해서는 대화하고 또 생각을 존중하고 맞춰나가는 것이 필요하다. 앞으로도 더 좋은 대..

[학습 일지 / day 54] 다시 공부!

오늘은 ddpm 논문 정리를 마무리하였고 또 데이터 제작 강의를 이어서 들은 하루였다. 익일에 예정된 오프라인 미팅을 위해서 강의를 열심히 듣고자 하였고 다 듣지는 못하였지만 8강까지 수강을 완료하였다. 코어 타임 이후의 저녁에는 수학 스터디를 준비하고 또 하였다. 회고 쓰는 게 점점 미뤄지는데 앞으로는 주의해야겠다. 데이터 관련 용어 정리 텍스트 : 주석, 번역, 서문 및 부록 따위에 대한 본문이나 원문 말뭉치 : 어떤 기준으로든 한 덩어리로 볼 수 있는 말의 뭉치(한 저작자의 저작 전부, 특정 분야 저작 전체) 데이터 : 정보-통신 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보 말뭉치 데이터 : 말뭉치 자체 말뭉치의 데이터 : 용례 색인 결과, 언어 추출 결과, 통계 분석..

[논문 같이 읽기] Denoising Diffusion Probabilistic Models

논문 링크 : Denoising Diffusion Probabilistic Models We present high quality image synthesis results using diffusion probabilistic models, a class of latent variable models inspired by considerations from nonequilibrium thermodynamics. Our best results are obtained by training on a weighted variational bound arxiv.org 유투브 설명 링크 : 수식 설명 링크 : [논문공부] Denoising Diffusion Probabilistic Models (DDPM) 설명 ─..

Data/논문 읽기 2022.12.06

[학습 일지 / day 53] 데이터 제작 시작

새로운 chapter가 시작되었다. 관계 추출 대회가 끝났고 이제는 데이터 제작에 들어가게 되었다. 인공지능을 쓰는 것 뿐만 아니라 입력으로 들어가는 데이터 제작까지 커리큘럼에 포함되어 있다는 것이 부캠의 좋은 점이다. 부스트캠프에 들어와서 Data Centric AI나 마스터 클래스 등을 들으면서 데이터의 중요성 그리고 데이터 제작의 필요성을 알게 되었었다. 관심이 있던 차였는데 이렇게 강의를 듣고 또 프로젝트를 하게 되었으니 정말 감사한 일이다. 열심히 또 재밌게 해봐야지. 최근에는 스스로가 많이 발전하고 있다는 느낌을 많이 받고 있다. 부캠 마지막까지 열심히해서 많이 배우고 많이 성장해서 나가야지. 잘 해보자. 화이팅이다. 학습 내용은 요약된 부분만 올리도록 하겠다. 데이터 제작의 중요성 데이터 구..

[학습 일지 / day 52] 프로젝트 정리 및 발표

오늘은 프로젝트 발표를 지원함에 따라 팀원들과 함께 발표 자료를 만들고 또 발표를 준비하는 시간을 가졌다. 오후 2시 경까지 발표 자료를 함께 만들었는데 그 과정에서 어떤 실험을 하였고 어떤 인사이트를 얻었었는지 되돌아 볼 수 있는 의미있는 시간이었다. 오늘 다시 돌이켜봤으니까 당분간은 까먹지 않지 않을까... 그리고 랜덤 피어섹션, 팀 피어섹션 이후에 발표를 맡아 하였다. 하지만 결과는 중간에 말이 꼬여 부족한 발표가 되었다. 진행한 내용들이 많았는데 그것들을 다 넣고 또 그에 덧붙여서 더 말하려고 하다보니 말이 꼬였고 말이 꼬인 것이 의식되다 보니 방향을 잃고 헤매게 되었다. 발표 준비를 더 했어야 했다. 하지만 사실 그만한 에너지가 남아있지는 또 않았다. 속으로 어떻게든 되겠지라고 생각했던 것이 화..