Anthropic, "The Anthropic Economic Index" 생성형 인공지능(AI) 기술이 노동에 미치는 영향에 대해 실제 데이터를 대규모로 분석하고 실증 연구한 보고서가 지난 2월10일 앤트로픽(Anthropic)에서 나왔다¹. 2021년에 설립된 앤트로픽은 ChatGPT를 발표한 오픈AI와 함께 주요 생성형 AI 스타트업으로 꼽힌다. 2023년 3월에 대규모언어모델(LLM) 기반 AI 서비스 ‘클로드(Claude)’를 출시했고, 이듬해 추론 기능이 더욱 강화된 ‘소넷트(Sonnet)’ 모델을 발표했다. 2024년 한 해 매출은 10억 달러(한화 1조 4천억 원)에 이른다². 올해 초 기준 이 회사의 기업가치는 600억 달러(한화 86조 6천억 원)이며, 구글과 아마존이 각각 30억 달러와 80억 달러를 투자한 것으로 알려져 있다³. |
|
|
“대부분의 직업이 사라지는 것이 아니라 진화할 것” |
|
|
앤트로픽은 창업 초기부터 ‘안전한 AI’에 중점을 두고 모델을 개발해 왔다. 투명성을 강조하는 AI 기술의 개발(Interpretability)과 인간의 가치를 충분히 학습 과정에 반영해 내는 모델 얼라인먼트(Alignment) 연구를 지속해 왔고, 나아가 사회에 미칠 영향(Societal impacts)에 대한 보고서도 냈다. 그러한 흐름에서 이번에 발표된 페이퍼는 경제, 특히 인간의 노동 전반에서 생성형 AI 모델이 어떻게 쓰이는지 실제 데이터를 기반으로 분석하고, 시간이 지남에 따라 AI가 미치는 영향을 확인할 수 있는 측정 도구를 제시했다는 데 의의가 있다. 모든 연구 데이터와 분석 툴, 논문은 웹사이트에 공개됐다⁴. |
|
|
이번 연구의 결론을 요약하자면 “대부분의 작업에 AI를 사용하는 직업이 소수에 불과하다면 미래에도 대부분의 직업이 사라지는 것이 아니라 진화할 것”이라는 것이다. 이는 물론 잠정적이다. 연구진이 밝힌 연구의 한계도 있는 만큼 앞으로 데이터가 쌓이면서 좀 더 정확한 결과가 나올 수 있다. |
|
|
AI와 인간 간 명령형보다는 협업형이 더 많아 |
|
|
연구진은 2024년 11월부터 1월까지 클로드에 올라온 대화 데이터 수백만 건을 분석했다. 예를 들어 사용자가 한국어 문서를 올리고 영어로 번역을 해 달라고 한 뒤 결과물을 보고 요약까지 해 달라고 요청했다면, 이 상호작용을 통째로 하나의 대화 데이터로 묶어서 성격에 맞게 분류한 것이다. 분류는 미국 노동부 산하 고용훈련청에서 개발한 직업 정보 데이터베이스 O*NET 체계를 활용했다⁵. O*NET은 직업들을 단지 직업군만 분류하는 데 그치지 않고, 경제 활동을 하는 데 필요한 기술과 지식, 능력들을 세부적으로 쪼개 만들어둔 데이터셋이다. 따라서 위 예시에서 사용자가 필요로 하는 ‘번역’과 ‘요약’은 O*NET 체계상 인지 능력(Cognitive Abilities), 그중에서도 언어능력(Verbal Abilities)으로 분류된다.
|
|
|
이러한 기술 분류를 바탕으로 연구진은 사용자와 AI의 상호작용을 ‘자동화 행동(Automate tasks)’과 ‘증강 행동(Augment tasks)’으로 나누어 분석했다. 자동화 행동은 인간 사용자의 개입은 최소화하면서 AI가 직접 과제를 수행하도록 하는 일이다. 아예 업무를 위임해서 일을 마치도록 ‘명령’하거나, 과제의 환경을 줘 가며 태스크를 마치도록 만드는 ‘피드백 루프’ 대화들이다. 예를 들면 프로그래밍할 때 “이게 내 코드인데 에러가 났네. 좀 고쳐줄래? (…) 다른 에러 메시지가 떴어. 다시 고쳐 봐.” 같은 대화가 자동화 행동에 들어간다.
|
|
|
증강 행동은 조금 차이가 있다. AI와 인간 사용자가 좀 더 협업을 하는 형태를 띤다. 함께 마케팅 전략을 짜 보자면서 대화를 주고받는 식의 ‘연속적 업무’ 대화나, 모르는 것을 이해시켜 달라고 묻는 ‘학습’ 행위, 인간 사용자가 만든 것에 대해 평가해달라고 묻는 ‘검증’ 작업 같은 것들이 여기에 들어간다. 예컨대 “강화학습에 대해 설명해 줄래?”라거나 “내가 지금 쓴 SQL 쿼리의 로직이 괜찮은지 한 번 봐 줘” 같은 대화 행동이 여기에 들어간다.
|
|
|
분석 결과, 전체 대화 중 57% 정도가 증강 행동에 해당됐다. 자동화 성격을 띤 경우는 43%였다. 세부적으로 볼 때 가장 많이 하는 상호작용은 함께 보고서를 써 내려가는 식의 ‘연속적인 업무’ 대화였고, 아예 “어떤 문서를 고쳐” 같이 ‘명령’하는 자동화 작용이 그 뒤를 이었다. 또한 무언가를 가르쳐 달라고 묻는 ‘학습’ 행위도 세 번째로 높은 비율을 차지했다. ‘검증’을 요하는 행동은 그리 많지 않았는데, 대부분이 외국어 표현에 대해 매끄러운지를 묻는 경우들이었다고 한다. 연구진은 “증강 행동과 자동화 행동이 섞여 있는 경우도 많았다”면서 “AI 도구는 사용자의 효용을 높이는 기능과 함께 협업 파트너로서의 기능까지 포괄해 향상시킬 필요가 있다”고 분석했다.
|
|
|
필요한 업무의 75% 이상에 AI 쓰는 직업은 4%에 불과 |
|
|
그러면 실제로 사용자들이 AI에 많이 의존하고, 또 얻어가는 기술은 무엇일까? 연구 결과 인지기능, 이를테면 비판적으로 사고하고, 독해하고, 프로그래밍하고, 글을 써 내려가는 부문에서 가장 높은 비율의 대화 양상이 나타났다. 위에서 언급한 것처럼 함께 생각하고 해석해 나가는 일련의 능력을 AI에 가장 많이 요구해 온 것이다. 다만 해당 데이터셋의 기반이 되는 서비스가 아직 이미지 생성 기술을 탑재하고 있지 않기 때문에, 함께 창작을 해나가려는 용도는 포착하지 못했다고 한다. 가장 의존도가 낮은 것은 우리가 예상할 수 있듯 물리적 상호작용 기반의 기술들이었다. |
|
|
그러다 보니 생각보다 한정적인 직군에서 제한적인 업무에 대해 AI를 쓰고 있는 것으로도 분석됐다. 전체 직군의 4% 미만이 자신의 직무 중 75% 정도에 대해 생성형 AI를 활용하는 것으로 분석됐다. 가령 외국어 교사의 경우 학습 자료를 만들거나 동료 협업 같은 일(업무 전체의 75%)에 대해 AI를 활용하는 것으로 나타났다. 하지만 학생 성적 관리나 장학 서류 작성 같은 25% 정도의 활동에서는 AI를 덜 쓰는 것으로 분석됐다고 한다. 또한 전체 직군의 7% 정도가 자신의 업무 중 절반 정도에 대해 AI를 썼는데, 마케팅 매니저들을 예로 들면 리서치나 전략 개발에서는 신기술을 쓰지만 트레이드쇼 코디네이션 같은 데서는 기존의 방법론을 따르는 걸로 보였다고 한다. 전체 직군의 20% 정도는 거의 쓰지 않는 것으로 나타났다. |
|
|
AI 기술이 인간의 일 전반에 영향을 미칠 것으로 알려져 있지만, 실제로 뜯어보면 AI가 깊이 관여하는 경우는 불규칙하게 산재해 있는 것으로 확인됐다. 연구진은 현재의 AI 활용이 특정 직업의 모든 업무를 통째로 자동화하기보다는 주로 직업 내 일부 행동을 대체하는 정도로 쓰이고 있다고 분석했다. |
|
|
중상위 임금 수준 노동자에서 가장 많이 쓰이는 AI |
|
|
AI 대화 데이터를 직군별 평균 수입에 따라 분석한 결과, 저임금과 최고 임금으로 갈수록 AI 서비스의 사용이 줄어든다는 결과도 나왔다. 중상위 임금에서 AI 사용량이 가장 많았는데, 해당 연봉권에 있는 소프트웨어 직군이 이러한 서비스를 가장 많이 쓴 영향이 있는 것 같다고 연구진은 밝혔다. 실제 직업 분석을 진행했을 때도, AI 서비스를 쓰는 직업군으로는 컴퓨터/수학 직군이 가장 많았고 그 뒤를 예술/엔터테인먼트/미디어 직군, 생명과학과 사회과학, 그리고 교육/도서관 직군이었다.
|
|
|
금융이나 고위관리직으로 가면 AI 사용량이 줄어들었다. 아주 많은 시간의 훈련과 학습이 필요한 의사, 변호사와 같은 직군에서도 마찬가지로 사용이 적었다. 예상할 수 있는 것처럼 물리적인 움직임이 절대적인 활동들, 가령 농업, 임업, 서비스직, 돌봄과 같은 직군에서도 또한 AI의 사용이 더딘 것으로 나타났다. 임금을 많이 받을수록, 반대로 적게 받을수록 AI 사용이 줄어드는 경향이 있었다.
|
|
|
이번 연구는 앤트로픽의 자체 생성형 AI 서비스에서 추출한 데이터를 중심으로 분석했다. 월 8천700만 명 정도가 쓰는 서비스로 알려져 있기는 하지만 사용성 측면에서 편향이 있을 수 있다. 해당 서비스가 코딩을 잘하는 어시스턴트 툴로 알려져 있고, 아직 이미지 분석 및 생성 서비스를 제공하지 않으며, 전문 데이터셋에 강화돼 있지 않아 전문가의 니즈도 충족하지 못한다는 점에서 연구의 한계도 있다. 또한 미국의 직무 기술 체계를 따르다 보니 전 세계 모든 곳의 직무와 맞아떨어지지 않을 수도 있다.
|
|
|
그럼에도 불구하고 모든 직업이 AI에 의해 대체될 것이라는 공포심과 AI 기술에 대한 과도한 기대감으로 시장의 거품이 두껍게 쌓였다는 우려들이 막연하게 퍼져있는 상황에서, 실증 데이터를 중심으로 직군별 사용 분포를 확인했다는 점에서 이 연구의 의미가 있다. 특히 직군과 직무, 그리고 그에 필요한 기술이 연결돼 있는 체계 안에서, AI가 잘 해낼 수 있고 혹은 앞으로 잘 해내야 할 지점이 무엇인지를 짚어냈다는 점에서 기술 발전의 내일을 점쳐볼 수 있다. 인간이 AI 기술의 도움을 받아 스스로를 강화할 수 있는 지점에 대해서도 시사점을 얻을 수 있을 것 같다.
|
|
|
☑️ 한국에서도 AI 기술 서비스들의 사용 사례와 실제 직무 기술을 매칭시켜 볼 수 있을 것이다. 한국 주요 산업에서 필요로 하던 직무들이 장기 관점에서 자동화된다고 할 때, 인력 이동은 피할 수 없다. 그렇다면 향후 인재 양성과 교육 관점에서 선제적인 전략 수립이 필요하고, 거기에는 이번 연구와 같은 직업-직무 결합형 데이터 분석이 필수적이다.
☑️ 기술을 통한 인간 능력의 증강은 ‘기계가 인간을 대체하는 것이 아니라, 기계를 쓰는 인간이 쓰지 않는 인간을 대체할 것’이라는 명제를 더욱 강화할 것이다. 하지만 특히 저임금 노동에서는 기술과의 접점이 더욱 멀어질 수 있다. 저임금 노동자의 증가가 자본 논리에 따라 기술 대체의 필요성을 낮출 수도 있다. 인간의 노동력이 기술보다 저렴해지기 때문이다. 이때 발생하는 격차는 어떻게 대처해야 할까? 이러한 격차가 생기기 전에 선제적 정책이 필요하다.
☑️ 정부 차원에서 AI 경쟁력을 높이기 위한 산업 및 연구 분야의 역량 강화 정책 수립과 지원이 이뤄지고 있다. 다만 생태계 강화 및 활성화를 위한 더욱 뾰족한 전략이 필요하다. 국가가 파운데이션 모델 개발 지원을 돕는 것이 나은지, 애플리케이션 개발 활성화를 위한 모태펀드 지원에 집중할 것인지, 생태계 필수 요소인 반도체에 보다 더 강점을 둘 것인지 등에 대해 전략적인 로드맵이 나와야 할 것이다.
AI는 이제 단순한 도구가 아닌 인간의 업무 파트너이자 협력자로 부상하고 있습니다. AI 경쟁력과 더불어 AI와 어떤 방식으로 일할 것인지를 결정하는 문제가 더욱 중요해질 텐데요. AI와의 협업에 있어 개인과 정부는 어떻게 대비해야 할까요? 여러분의 의견을 기다립니다.
|
|
|
재단법인 태재미래전략연구원 media@fcinst.org 서울특별시 종로구 백석동길 224
|
|
|
|
|