tokenclassification 3

Evaluating Student Writing_1st Place Solution

feedback-nn-train Explore and run machine learning code with Kaggle Notebooks | Using data from Feedback Prize - Evaluating Student Writing www.kaggle.com 참여했던 캐글 공모전의 1nd place solution을 분석해보려고 한다. 작성된 method 위주로 리뷰를 해보겠다. 교집합, 즉 얼마나 두 집단이 겹쳐있느냐를 파악하는 함수. set()을 활용했다. f1_score를 구하는 함수. log와 slient를 파라미터로 주어 slient에 따라 함수 아래의 문장을 실행하도록 하였다. 예측값과 실제값의 고유값을 비교해주고자 한듯 하다. slient는 오타인 것 같다. 그리고 아래에서..

Data/코드 리뷰 2022.04.03

Evaluating Student Writing_2nd Place Solution

2nd Place Solution - [CV741 Public727 Private740] Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com 최근에 참여했던 캐글 공모전의 2nd place를 차지한 코드를 리뷰하고자 한다. 공모전 참여 기간 동안 노트북 작성자의 코드를 보며 많이 배웠기 때문에 최종 코드 또한 살펴보고 싶었다. 코드를 직접 돌려볼 수 있는 환경이 되지 않아서 코드를 읽고 분석하는 작업만 수행하고자 한다. Inference Script with Post Process The following Python script accepts a fi..

Data/코드 리뷰 2022.03.24

Hugging Face, Token classification

Main NLP tasks - Hugging Face Course The first application we’ll explore is token classification. This generic task encompasses any problem that can be formulated as “attributing a label to each token in a sentence,” such as: Of course, there are many other types of token classification huggingface.co 이전에 Tokenizer에 대해 학습하였는데 이제는 그것을 활용해서 토큰을 분류해주는 Token classification에 대해 학습해보고자 한다. 여기서 소개하는 것은..

Data/Information 2022.03.16