느린 일지/부스트캠프 AI Tech 4기

[학습 일지 / day 53] 데이터 제작 시작

neulvo 2022. 12. 6. 09:05

새로운 chapter가 시작되었다.

관계 추출 대회가 끝났고 이제는 데이터 제작에 들어가게 되었다.

인공지능을 쓰는 것 뿐만 아니라

입력으로 들어가는 데이터 제작까지 커리큘럼에 포함되어 있다는 것이 부캠의 좋은 점이다.

 

부스트캠프에 들어와서 Data Centric AI나 마스터 클래스 등을 들으면서

데이터의 중요성 그리고 데이터 제작의 필요성을 알게 되었었다.

 

관심이 있던 차였는데 이렇게 강의를 듣고

또 프로젝트를 하게 되었으니 정말 감사한 일이다.

열심히 또 재밌게 해봐야지.

최근에는  스스로가 많이 발전하고 있다는 느낌을  많이 받고 있다.

부캠 마지막까지 열심히해서 많이 배우고 많이 성장해서 나가야지.

잘 해보자. 화이팅이다.

학습 내용은 요약된 부분만 올리도록 하겠다.

 

데이터 제작의 중요성
데이터 구축 과정과 설계 기초
자연어 처리 데이터

원시 데이터 선정 및 확보 - 저작권, 태스크 적합성

구축 및 가공 프로세스 확립 - 구축 및 검수 절차, 작업자 선정

구축 및 가공 지침 작성 - 플랫폼 소통 및 작업자 교육

데이터 구축 및 가공 - 파일럿, 작업자 관리

데이터 검수 - 품질 평가 기준, 데이터 규격, 내용

데이터 설계 - 데이터의 형식, 데이터 표상 영역

데이터 수집-가공 설계 - 원천 데이터 수집 방식, 주석 작업

728x90