분류 전체보기 966

[Happy_whale] EffNet Train & RAPIDS Clusters

🐳Whales&Dolphins: EffNet Train & RAPIDS Clusters Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com 앞서 리뷰한 코드와 같은 사람이 작성한 코드다. 그래서인지 이해하기 수월했고 학습 과정까지 전 과정이 담겨있어서 좋았다. 라이브러리 import하고 색상 설정하는 부분. cuml 라이브러리가 CUDA 호환성 문제로 import 되지 않아서 sklearn의 유사 함수를 불러왔다. 성능 차이가 있는 지는 모르겠지만 코드 실행에는 문제가 없었다. line plot으로 loss를 그려주는 함수. value text를 plo..

Data/코드 리뷰 2022.04.11

[Happy_whale] EffNet Embedding cos Distance

🐬Whales&Dolphins: EffNet Embedding cos Distance Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com HappyWhale 2022 케글 공모전의 코드. 담고 있는 내용이 많고 좋은 것 같아서 리뷰해보고자 한다. 라이브러리 import 및 색상 설정. Wandb에 login하는 코드이다. Wandb는 AI 학습 Tracking 및 시각화 서비스를 제공하는 사이트인데 이번 코드를 통해서 알게 되었다. plot에 text를 출력해주는 함수. v와 h는 vertical, horizontal np.ndenumerate는 배열의..

Data/코드 리뷰 2022.04.07

Evaluating Student Writing_1st Place Solution

feedback-nn-train Explore and run machine learning code with Kaggle Notebooks | Using data from Feedback Prize - Evaluating Student Writing www.kaggle.com 참여했던 캐글 공모전의 1nd place solution을 분석해보려고 한다. 작성된 method 위주로 리뷰를 해보겠다. 교집합, 즉 얼마나 두 집단이 겹쳐있느냐를 파악하는 함수. set()을 활용했다. f1_score를 구하는 함수. log와 slient를 파라미터로 주어 slient에 따라 함수 아래의 문장을 실행하도록 하였다. 예측값과 실제값의 고유값을 비교해주고자 한듯 하다. slient는 오타인 것 같다. 그리고 아래에서..

Data/코드 리뷰 2022.04.03