느린 일지/부스트캠프 AI Tech 4기

[학습 일지 / day 9] 어쩌다 보니 벌써 12시

neulvo 2022. 9. 30. 00:04

와 정말로 이게 이렇게까지 길어질 줄 몰랐다.

사실 주말에 하려고 했던 건데

어제까지 스피디하게 강의랑 과제를 끝내고 나니

오후 시간이 되니까 무료해져서 손을 댄게 화근이었다.

(사실 뿌듯함)

 

아무튼 그래서 word2vec과 seq2seq 관련 논문들의

정리를 끝냈다.

그 개념이나 구조를 자세히 설명한 것은 아니고

번역을 조금 열심히 해서

논문 읽는 사람이 편하게 읽기 만든 그런 느낌?

 

너무 또 개념을 딥하게 들어가면

자료도 만들어야 하고 힘들 거 같단 말이지

이것도 쉽지는 않았지만 이게 또 잘 맞았던 것 같다.

 

오늘 수강한 강의는 병렬 처리에 대한 부분인데

모델 병렬 처리나 데이터 병렬 처리 등에 대해 배웠다.

사실 컴퓨팅 리소스가 바탕이 되야 하니까

나중에 필요하면 더 찾아보겠단 마음으로 가볍게 들었다.

(앗, 이거 들키면 안되나)

 

그래도 Ray라는 라이브러리에 대해 알아두는 건 좋을 것 같다.

 

Welcome to the Ray documentation — Ray 2.0.0

If you’re new to Ray, check out the getting started guide. You will learn how to install Ray, how to compute an example with the Ray Core API, and how to use each of Ray’s ML libraries. You will also understand where to go from there.

docs.ray.io

 

아, 그리고 트러블 슈팅 코드 하나는 적어두고 싶다.

oom = False
try:
	run_model(batch_size)
except RuntimeError:
	oom = True
    
if oom:
	for _ in range(batch_size):
    	run_model(1)

oom(out of memory)가 발생했을 때

batch_size를 1로 만들어 모델을 돌리는 코드이다.

batch_size 줄여서 모델을 돌리면 문제를 확인하기 쉽다고 한다.

 

오늘은 이정도인가?

피어섹션은 모각공으로 진행했고

오피스아워는 시간이 빠듯했지만

과제 자료나 내용이 너무 충실해서 많은 도움이 또 됐다.

 

오늘은 이만 마무리해야지

내일은 조금 여유있게 해도 괜찮지 않을까? ㅎㅎ

728x90