들어가며
오늘은 데이터라벨링과 관련한 교육이 있는 날이다. 용어 자체는 많이 들어봤지만 정확한 의미는 모르고 있었기 때문에 이번 기회를 통해서 데이터라벨링의 의의를 알아가보자.
유클리드소프트
데이터 라벨링에 대한 교육을 받기 전, 박주한 대표님께서 유클리드소프트가 걸어온 길을 소개해주셨다. 분야 별 직원 수도 함께 알려주셨는데 역시 IT기업답게 80명중 52명이 기술엔지니어로 종사하고 계셨다. 또한 대표님께서 덧붙여 말씀하시길 최근 들어 기획분야의 채용도 적잖게 늘어났다고 하셨다.
데이터 엔지니어 | 15명 |
프론트엔드/백엔드/풀스택 | 33명 |
AI / DATA 분석가 | 8명 |
아키텍처 활용의 중요성도 강조하셨다. elastic, k8s, docker 등 개발자를 준비하는 사람이라면 한번씩은 들어봤을 법한 툴인데, 이러한 아키텍처를 사용할 줄 아는 것에서 그치는 것이 아니라 어떤 방향으로 잘 활용을 할 수 있는지까지 더 깊게 생각해봐야 할 것 같다.
대표님께서 설명해주신 용어 중 MLOps라는 것도 기억에 남는데, Machine Learning과 Devops의 합성어로 프로덕션 환경에서 기계학습 모델을 안정적이고 효율적으로 배포하고 유지하는 것을 목표로 하는 패러다임을 의미한다. 그러면 Devops는 무엇인가를 알아야 하는데, 애플리케이션과 서비스를 빠른 속도로 제공할 수 있도록 조직의 역량을 향상시키는 문화 철학, 방식 및 도구의 조합을 말한다. Devops는 코딩과 인프라 관리, 시스템 관리를 포함하여 개발 뿐만 아니라 전반적인 운영에 대한 광범위한 역량을 갖춰야한다. MLOps를 사용하면 기계학습 모델을 더 빠르게 배포하고 시간이 지남에 따라서 정확도가 향상됨과 동시에 실제 비즈니스 가치를 높일 수 있다. 번외로 잡코리아를 탐색하다가 유클리드소프트에서 파이썬개발자 채용공고를 발견했는데, 그 담당업무가 MLOps였다. 채용되실 분에게 미리 축하드린다는 말씀 드리고 싶다.
데이터라벨링(Label On)
데이터라벨링이라는 용어는 학과 연구실 알바 공지로 처음 접하게 되었다. 개당 30원, 시간 당 만원, 하루 1500~2000개였던 기억이 난다. 그 때는 라벨링이 정확히 어떤 일을 하는지 개념이 잡혀있지 않아서 그저 읽고 넘겼지만, 이번엔 직접 어떤 활동인지 확실하게 짚고 넘어가보자.
먼저 데이터라벨링의 정의는 인공지능의 학습을 위해 필요한 데이터 가공작업을 수행하는 것이다. 소개해주신 라벨링기법은 다음과 같다.
- Bounding Box : 객체의 범위를 사각형 박스로 지정하는 기법
- Segmentation : 객체의 모양에 따라 점을 연속적으로 찍음으로써 선으로 연결
- Key Point : 사람의 움직임이나, 표정 등을 읽을 때 사용하는 기법
- Textual Question Answering : 주어진 텍스트 문서에서 사용자의 질문에 대한 답을 추출
- Visual Question Answering : 이미지 또는 비디오와 같은 시각적 데이터를 이해하고 해당 시각적 콘텐츠에 대한 자연어 질문에 답변하는 것을 목표
- Sementic : 이미지나 비디오 내의 각 픽셀에 의미있는 클래스를 부여하는 기법
개인적으로 라벨링 예시로 가장 많이 접한 기법은 Bounding Box였다.
Request For Proposal
진행 순서
- 데이터 설계
- 영상수집
- 영상데이터
- 분류완료데이터
- 중복제거
- 정제데이터
- Annotation 작업자-가공
- 평가 및 검수
- AI학습용 데이터 DB저장
- 인공지능 서비스 활용
마지막엔 제안 요청서를 바탕으로 회사의 입장에 서서 어떤 흐름으로 프로젝트를 수행할 수 있을지 직접 기획하고 발표하는 시간을 가졌다. 우리 조는 양봉 데이터를 바탕으로 꿀벌의 건강과 벌집 상태를 모니터링하여 경제적, 환경적으로 중요한 역할을 하고있는 양봉산업에 이바지하는 것을 구축 목적으로 삼았다. 꿀벌과 벌집의 이미지 데이터를 어떻게 라벨링 할 것인지 선정한 라벨링 기법에 따른 이유를 명시했더라면 더 좋았을 것 같다.
마무리
약 1시간 동안 주어진 과제에 대해 준비하고 발표까지 해내는 경험은 처음이었다. 그리고 데이터 라벨링의 필요성과 그 규모에 대해 알 수 있어서 좋았고, 즉석에서 편성된 조원 분들 모두 열심히 준비해준 것에 정말 감사함을 느꼈다.
'ABC부트캠프 테크노트' 카테고리의 다른 글
[31일차] ABC부트캠프 : 최종 프로젝트(1) (0) | 2024.08.18 |
---|---|
[30일차] ABC부트캠프 : IS프로젝트 교육(발표 요령) (0) | 2024.08.14 |
[28일차] ABC부트캠프 : NVIDIA 트랜스포머 기반 NLP 애플리케이션 구축 (0) | 2024.08.12 |
[27일차] ABC부트캠프 : NVIDIA 딥러닝의 기초 (0) | 2024.08.09 |
[26일차] ABC부트캠프 : 미니프로젝트 발표 (0) | 2024.08.08 |