본문 바로가기

디지털 세상

데이터 라벨링

안녕하세요?

요즘 뜨는 알바로 데이터 라벨링이라고 들어 보셨나요?

데이터 라벨링은 대부분의 경우 전문적인 기술이 필요하지 않고 재택근무가 가능하고 집중력과 끈기가 있으면 할 수 있다고 해요.

그렇기 때문에 학생, 주부, 휴직자, 직장인 투잡, 취업준비생 등등 많은 사람들이 하고 있다고 합니다


많은 재택 알바들 중에 데이터 라벨링 이 주목받는 것은 무슨 이유일까요?


정부에서는 4차 산업시대에 데이터 뉴딜 정책으로 데이터를 조성하기 위해 2025년까지 2조 5000 억 원을 투입한다는 계획을 밝혔습니다

그에 따라 관련 스타트업 회사들이 늘어났으며 데이터 수집, 가공하는 데이터 노동. 데이터 라벨러들이 늘어나고 있습니다

 

 

 


데이터 라벨링이라는 것은 무엇일까요

< 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업을 말한다 사진이나 동영상 등에 등장하는 동물 사물 등 모든 것에 라벨을 달아 AI에 주입하면 AI는 이를 바탕으로 데이터들을 학습하면서 유사한 이미지를 인식할 수 있게 된다 >
라고 네이버 지식백과에서 말해주네요

 

데이터  라벨링 업무 예를 들면

 

사람은 사과와 오렌지, 배를 다양한 모습과 환경 속에서도 구별하기가 쉽습니다  

작은 사과, 큰 사과, 썩은 사과, 반쪽 자른 사과, 나뭇잎에 적당히 가린 사과, 빨갛게 익은 사과, 푸른 사과, 품종별 사과, 데코레이션 된 사과, 그늘 속에 있는 사과, 위에서 본 사과, 옆에서 본 사과 등등 다양한 모습의 사과를 봐도 사람은 사과라는 걸 압니다 AI도 역시 제대로 분별해내기 위해 인식시키는 학습 활동들이 데이터 라벨링 작업 예가 될 것입니다

 


AI는 도로 자율주행 환경에서도 단지 센서에 의해서만 작동되는 것이 아니라

도로 위의 차선의 표시, 신호등, 도로표지판, 교통흐름 등등 복합적인 주변 상황을 사람처럼 종합 판단하기 위해 정보들을 쌓고 더욱 구체화하면서 통계화하고 예외도 학습하면서 오류를 줄이는 과정들이 필요할 것입니다.

 사람은 도로위 차선 사진을 볼 때 실선과 점선 구분을 합니다 눈으로 보이는 것만으로 구분하는 게 아니라 원래 실선인데 차바퀴에 가려 끊어져 보이거나 도로 파임 등으로 일부 점선처럼 보이는 상황일지라도 상황 판단에 따라 구분하는 것이지요. 데이터 라벨링을 통해 AI가 여러 상황을 구분해내기 어렵지 않도록 학습시켜줍니다

 


얼굴이나 음성인식 데이터 구축 작업도 포함되는데요
사람마다 얼굴과 목소리는 다 다르지만 사람은 처음 보는 얼굴과 처음 듣는 목소리일지라도 그 사람의 감정을 느낄 수 있습니다

이런 판단을 AI도 정확히 할 수 있도록 화나고 놀라고 기쁘고 슬프고 원하고 만족하고 싫어하고 졸리고 등등 을 카메라 촬영이나 음성 녹음을 통해 다량의  데이터를 만들어 상황별 학습을 AI에게 시킵니다  이렇게 데이터 라벨링 알바로 하루 종일 촬영을 하기도 합니다

 

 

 

 

 


좀 더 전문적인 데이터 라벨링 업무로는 번역자료를 검수해서 데이터화 한 후 파파고에 학습자료로 삼기도 합니다

 

AI가 인식한 자료들을 점검하며 오류들을 찾아 걸러내기도 합니다

 

이런 이야기를 하고 있으니  어릴 때 보던 공상과학영화에 나왔던 장면들이 떠오릅니다
로봇이나 기계 또는 손목시계에 명령을 내리면
다 알아서 판단해서 착~ 하고 대령해주는 것이요
그게 정보이건 아이디어 건 말이지요


데이터 라벨러 알바나 직원 모집 공지를 보면 월급제인 경우 월 200만 원 정도에 나와 있는 걸 보았고
건당 요금은 일 마다 차이가 있지만 시급 6천~1만 정도 하는 것 같아요 경우에 따라서는 건당 10만 원. 일당 100만 원도 있다고는 하지만 흔하지 않은 경우겠지요


실제 데이터 라벨링 일하는 사람들 말로는  2.3주에 100만 원 정도이고 일한 만큼 더 벌기도 한다고 합니다. 대체로 업무 만족도는 높은 편이라 지인에게 소개하고 같이 일하는 경우도 있다고 합니다만 장기적으로 본업으로 하기엔 안정적이지 않다는 의견도 있습니다

데이터 라벨링 일하려고 하는 사람이 늘어날수록 단가도 내려갈 것이라는 예측도 봅니다. 많은 수익모델들이 그랬듯이 말입니다. 하지만 요즘 같은 때는 뭐라도 일거리가 있으면 땡큐인 경우도 많은 게 또 사실입니다


정부 투입금 2조 5 천억 원이라고 하면 어마어마한 비용이 투입되는 건데... 콩고물이 엄한데 많이 떨어지지 않고 정말 미래사회 먹거리를 준비하는데 바르게 잘 쓰이면 좋겠습니다