Data 49

[논문 같이 읽기] Efficient Estimation of Word Representations in Vector Space

논문 링크 : Efficient Estimation of Word Representations in Vector Space We propose two novel model architectures for computing continuous vector representations of words from very large data sets. The quality of these representations is measured in a word similarity task, and the results are compared to the previously best per arxiv.org 참고 자료 링크 : 02) 워드투벡터(Word2Vec) 앞서 원-핫 벡터는 단어 벡터 간 유의미한 유사도를 계산..

Data/논문 읽기 2022.09.29

[Vs Code] conda 가상 환경 변경 안 될 때

Vs code 프로그램에서 위의 보기와 같이 conda activate (가상환경명) 명령어로 가상 환경을 변경해주려 함에도 잘 안 될 때가 있다. 그 문제는 사실 Terminal의 기본 설정이 powershell로 되어있기 때문이었고 위와 같이 Command Prompt로 Terminal을 열어준다음 Conda activate (가상환경명) 명령어로 가상환경을 변경해주면 잘 작동하는 것을 확인할 수 있다.

Data/Errors 2022.09.26

re - 정규식 연산

re — 정규식 연산 — Python 3.10.4 문서 re — 정규식 연산 소스 코드: Lib/re.py 이 모듈은 Perl에 있는 것과 유사한 정규식 일치 연산을 제공합니다. 패턴과 검색 할 문자열은 모두 유니코드 문자열(str)과 8비트 문자열(bytes)이 될 수 있습니 docs.python.org re — Regular expression operations — Python 3.10.4 documentation re — Regular expression operations Source code: Lib/re.py This module provides regular expression matching operations similar to those found in Perl. Both patter..

Data/Information 2022.04.22

정규표현식 python re

정규식 HOWTO — Python 3.10.4 문서 대소 문자를 구분하지 않는 일치를 수행합니다; 문자 클래스와 리터럴 문자열은 대소 문자를 무시하여 문자와 일치합니다. 예를 들어 [A-Z]는 소문자와도 일치합니다. ASCII 플래그로 ASCII가 아닌 docs.python.org Regular Expression HOWTO — Python 3.10.4 documentation Perform case-insensitive matching; character class and literal strings will match letters by ignoring case. For example, [A-Z] will match lowercase letters, too. Full Unicode matching a..

Data/Information 2022.04.22

[Happy_whale] EffNet Train & RAPIDS Clusters

🐳Whales&Dolphins: EffNet Train & RAPIDS Clusters Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com 앞서 리뷰한 코드와 같은 사람이 작성한 코드다. 그래서인지 이해하기 수월했고 학습 과정까지 전 과정이 담겨있어서 좋았다. 라이브러리 import하고 색상 설정하는 부분. cuml 라이브러리가 CUDA 호환성 문제로 import 되지 않아서 sklearn의 유사 함수를 불러왔다. 성능 차이가 있는 지는 모르겠지만 코드 실행에는 문제가 없었다. line plot으로 loss를 그려주는 함수. value text를 plo..

Data/코드 리뷰 2022.04.11

[Happy_whale] EffNet Embedding cos Distance

🐬Whales&Dolphins: EffNet Embedding cos Distance Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com HappyWhale 2022 케글 공모전의 코드. 담고 있는 내용이 많고 좋은 것 같아서 리뷰해보고자 한다. 라이브러리 import 및 색상 설정. Wandb에 login하는 코드이다. Wandb는 AI 학습 Tracking 및 시각화 서비스를 제공하는 사이트인데 이번 코드를 통해서 알게 되었다. plot에 text를 출력해주는 함수. v와 h는 vertical, horizontal np.ndenumerate는 배열의..

Data/코드 리뷰 2022.04.07

Evaluating Student Writing_1st Place Solution

feedback-nn-train Explore and run machine learning code with Kaggle Notebooks | Using data from Feedback Prize - Evaluating Student Writing www.kaggle.com 참여했던 캐글 공모전의 1nd place solution을 분석해보려고 한다. 작성된 method 위주로 리뷰를 해보겠다. 교집합, 즉 얼마나 두 집단이 겹쳐있느냐를 파악하는 함수. set()을 활용했다. f1_score를 구하는 함수. log와 slient를 파라미터로 주어 slient에 따라 함수 아래의 문장을 실행하도록 하였다. 예측값과 실제값의 고유값을 비교해주고자 한듯 하다. slient는 오타인 것 같다. 그리고 아래에서..

Data/코드 리뷰 2022.04.03