인공지능(AI) 시대의 핵심 가치는 데이터고 데이터는 플랫폼을 통해 수집되고 처리된다. 플랫폼은 반드시 AI를 전제하지 않지만 AI 시대에는 인간 노동이나 관여가 최소화된 형태의 AI 플랫폼이 주류를 이루게 될 것이다. 장래 AI 플랫폼을 기반으로 하는 경제 구조에서 데이터 가치가 어떻게 생산되고 배분돼야 하는지를 분석하면서 동시에 이와 밀접하게 관련된 사회 이슈도 같이 살펴보고자 한다.
◇ 미래사회 시장 가치순환 구조 복잡해
전통 시장에서 가치순환 구조를 살펴보면, 소비자는 기업으로부터 재화나 용역을 구매하면서 대가를 지급한다. 기업은 대가를 임금 형태로 노동자에게 배분하며, 노동자는 배분받은 임금으로 다시 소비 활동을 한다. 이 과정에서 기업은 소비자로부터 데이터를 수집해 활용할 수 있겠지만 여러 제약 때문에 사실상 기업이 얻는 데이터 가치는 매우 낮았다.
AI 플랫폼이 보편화되면서 수집되는 데이터 량과 질이 월등히 달라지는 장래 사회에서는 시장의 가치순환 구조가 훨씬 복잡해진다. 소비자가 기업으로부터 재화나 용역을 구매하면서 대가를 지급하는 과정에 AI 플랫폼이 개입해 소비자로부터 데이터를 수집하고 데이터를 통해 새로운 가치를 창출해 내기 때문이다. 이처럼 AI가 개입해 독자적인 경제 의미를 가지는 데이터 가치는 전통 시장에서는 발견하기 어려운 요소다. 특히 데이터는 사용에 의해 가치가 소진되는 것이 아니라 축적된다는 점에서 더 특별한 의미가 있다. 기업이 소비자로부터 수집한 데이터를 가공·분석해 수익을 올리는 시간이 쌓일수록 데이터도 계속 쌓여간다. 기업은 더 많이 축적된 데이터로부터 더 나은 기술을 적용해 분석하며, 더 많은 수익을 올리면서 데이터 가치를 극대화시킨다. 전통 시장의 가치순환 구조와 비교하면 데이터 가치의 비중이 눈에 띄게 크다고 볼 수 있다.
2011년 통계를 보면 데이터 기반 의사결정 경영을 하는 기업 생산성은 그렇지 않는 기업보다 5~6%정도 높다(Brynjolfsson 등). 2014년 통계에 따르면 8~13% 정도 차이가 난다(Bakhshi 등). 데이터 축적이 가속화되고 알고리즘이나 분석 기술이 빠르게 진일보한 장래에는 기업이 얻는 수익률 차이는 더 크게 날 것으로 예상된다. 실제로 시장에서 차지하는 플랫폼 기업의 경제 비중은 계속 커지고 있다.
◇ 데이터 가치 배분과 보상
데이터로부터 창출된 새로운 가치(특히 AI 플랫폼을 통해 극대화될 데이터 가치)를 기업이 어떻게 배분하고 보상해야 정당한지에 대해 아직 정립된 이론은 없지만 점차 세부 논의가 이뤄지고 있다. 특히 이는 데이터 가치 성격과 밀접한 관련이 있어, 이해를 위해서 실제로 제기됐던 주장과 가정적인 주장을 종합적으로 살펴보기로 한다.
첫째, 데이터 가치는 기업의 자본가 즉 주주에게 배분돼야 한다는 주장이 있다. 주주 투자로 인해 기업은 AI 플랫폼을 설치·운영할 수 있다. 그로 인해 소비자 데이터를 대량으로 수집하고 처리할 수 있었으므로 결국 AI 플랫폼 기업의 소유주인 주주에게 데이터 가치가 배분돼야 한다는 입장이다. 이는 데이터를 기업의 자본재로 보고, 데이터 가치를 자본가치 연장으로 이해한다.
하지만 AI 플랫폼 사유를 인정하는 것과 별개로, 데이터는 기본적으로 소비자로부터 나왔음에도 전적으로 자본가의 소유로 보고 데이터 가치를 독점하면서 소비자에게는 아무런 보상도 하지 않는 것은 부당하다는 반론이 가능하다. 더불어 이를 견지한다면 기업으로부터 보상을 받지 못하는 소비자는 양질의 데이터 공급에 소극적이기에 플랫폼의 지속 가능성이나 산업 발전에 부정적인 결과가 생길 것이라는 반론도 가능하다.
둘째, 데이터 가치는 상품과 같이 노동자에게 배분돼야 한다는 주장이 있을 수 있다. 데이터 생산은 소비자로부터 이루어지지만 그 과정에서 노동자 수고와 노력이 투입됐기 때문이다. 즉 노동자가 상품을 제조해 판매하는 것처럼 데이터를 수집·처리할 수 있게 AI 플랫폼을 개발하고 운영하는 주체는 노동자인 바, 상품과 동일하게 데이터 가치를 노동자에게 배분해야 한다고 주장할 수 있다. 이에 대해 무료로 소비자로부터 수집되는 데이터와 유상으로 소비자에게 제공되는 상품은 본질적으로 구별되며, 인간 개입이 최소화된 형태의 AI 플랫폼에서 노동자 기여를, 상품 제조·판매에서 노동자 기여와 같게 볼 수 없다는 반론이 있을 수 있다.
셋째, 데이터 가치는 데이터를 제공한 소비자에게 보상 방법으로 귀속돼야 한다는 주장이 있다. 데이터를 소비자의 노동(활동) 산물로 보는 입장으로서, 소비자 노동(활동)의 결과로 데이터 가치가 창출됐으므로 소비자에게 적절한 보상이 있어야 한다는 논리다. 예컨대 마이크로소프트리서치의 글렌 웨일 등은 데이터가 특정 플랫폼의 고정자본으로 소유되는 것은 기업가 정신의 함양에는 도움이 되겠지만 소비자에게 보상이 이뤄지지 않는다면 양질의 데이터 생산에 차질이 발생하므로 비효율적이라는 주장이다.
이 주장에 의하면 데이터 생산 활동이 또 하나의 노동시장이 되는 것이고, 데이터 소유권은 소비자에게 있으며 데이터가 새로운 디지털 존엄성의 원천이 된다고 본다. 이는 데이터 가치는 소비자 노동으로만 형성되는 것은 아닌 바 AI 플랫폼 기여가 무시됐으며, 데이터를 소비자 노동의 산물로만 본다면 오히려 기업의 데이터 혁신에 대한 의욕이 감소할 것이라는 반론이 가능하다.
넷째, 데이터를 천연자원과 같이 만인의 자연재로 보아 기업이 얻은 데이터 가치는 사회구성원에게 집단으로 배분돼야 한다는 주장이다. 예컨대 데이터가 햇빛과 같다는 입장이다. 이에 따르면 기업은 획득한 데이터 가치를 사회구성원에게 무조건적, 보편적으로 배분해야 한다. 배분 형태는 최근 많이 논의되는 기본소득이론과 가깝고, 집단 배분을 전제로 한다는 점에서 개별 보상을 전제로 하는 세 번째 주장과는 차이가 있다. 이에 대해서는 데이터를 만인의 자연재로 본다면 실제로 기업이 보유한 데이터에 대한 접근권이 차별 없이 보장돼야 하는데 현실에서는 그렇지 않다는 반론이 가능하다.
다섯째, 데이터를 공공재 또는 인프라로 이해하는 입장이 있을 수 있다. 데이터의 개별 소유권을 부정하면서 동시에 데이터는 사회 전체의 이익을 위한 공공재 또는 인프라에 해당한다. 누구든지 접근이 가능해 사용할 수 있고 이익의 향유는 사회 구성원 모두에게 귀속돼야 한다는 입장이다. 데이터의 자유로운 접근과 활용을 강조하는 입장이다. 이에 대해서는 데이터를 공공재 또는 인프라로 보는 것은 정책의 문제이지 현상의 문제는 아니라고 지적할 수 있다. 또 공공재 또는 인프라 성격을 지나치게 강조하면 프라이버시 개념이 약해지고 동시에 기업의 자유로운 경쟁이나 이를 통한 산업 효율성 달성에 반하는 결과가 된다는 반론이 가능하다.
◇ 데이터 가치배분에서 고민해야할 네 가지
지금까지 데이터 가치의 배분 내지 보상에 대해 존재하거나 있을 수 있는 제반 주장들을 살펴보았다. 보다 심도있는 사회 논의와 합의가 필요할 것이다. 이 주제는 특히 논리적으로 '데이터 가치 성격' '데이터 소유권 귀속 문제' '기본소득 문제' '데이터 공유나 수용 문제' 등과 직접적으로 연결돼 있다. 이 이슈는 데이터 가치 배분에서 반드시 선결적으로 고민해야 하는 문제다.
우선 데이터 가치의 성격이다. 개별소재로서 데이터는 노동가치적 성격이 있지만 집합물 또는 총체로서 데이터(예컨대 데이터베이스)는 자본 가치적 요소가 반영되지 않고서는 불가능하다. 데이터 가치 성격을 데이터 형태나 형성 기여 등을 고려하지 않고 하나로 결론내리는 것은 바람직하지도 않고 불가능하다. 즉 데이터 가치 성격은 데이터 형성 과정을 기반으로 개별적으로 파악하는 것이 적절하다.
데이터 소유권 귀속 문제도 데이터 가치의 성격 문제와 밀접한 관련이 있다. 즉 데이터 소유권도 데이터 형성 과정을 기반으로 결정해야 한다. 데이터의 가공 단계나 처리 정도에 따라 데이터 가치에 대한 기여도가 달라질 수 있으므로 데이터 소유권은 원칙적으로 데이터 가치 형성에 기여도를 반영해 결정함이 공평의 원칙에 부합할 수 있을 것으로 생각된다.
기본소득 문제의 경우, 기업에서 노동 가치 비중이 낮아지고 그 대신 데이터 가치 비중이 높아지는 상황이 온다면, 감소된 노동 가치를 증가된 데이터 가치로 전보하는 차원에서 기본소득 도입 여부를 논할 필요가 있다. 이는 논리 관점에서 접근해야 하는 데이터 가치 성격이나 데이터 소유권 문제와 달리, 정책 관점에서 다루어야 할 문제다. 기본소득 논의에 따라 데이터 가치 배분에 있어서 일정한 조정이 일어날 수 있을 것이다. 마지막으로 데이터 공유나 수용 문제는 해당 데이터의 사회 의미나 특성에 따라 정해질 수 있다. 예컨대 특정 데이터가 개인 이익보다는 사회전체 공공의 이익과 밀접한 관련이 있다면 이를 공공재로 분류할 수 있다. 이 경우 데이터 공유나 수용이 용이하게 전개될 수 있을 것이다.
데이터 가치 배분 기준에 대한 여러 가지 입장 그리고 결론을 찾기 위한 전제로서 다뤄야 할 주제를 간략하게 정리했다. 중요한 점은 앞으로 AI 시대의 데이터 가치는 전통적인 노동보다는 AI 알고리즘이나 플랫폼에서 발생하는 가치가 될 것이어서 새로운 시각에서 분석할 필요가 있다는 것이다. 특히 데이터 가치 창출 과정에서 인간이 주축이 되지 않기 때문에 논리적으로만 접근하면 인간의 소외가 일어날 수 있다. 단순 논리 해결보다 인간을 중심에 두고 종합적인 관점에서 접근해야 한다. 데이터 가치를 어떻게 파악하느냐에 따라서 국가의 미래 데이터 전략과 데이터 경제 구조 전체가 달라질 수 있다. 어떤 경우든 데이터 가치가 노동 등 인간의 고유한 가치를 짓밟는 수단으로 활용돼서는 안 된다. 오히려 인간 존엄성을 유지하고 보호하는 수단으로 활용할 수 있도록 면밀하게 살펴서 데이터 정책을 펴 나가야 할 것이다.
* 법무법인 민후 김경환 변호사 작성, 블로그(2020. 5. 19.), 전자신문(2020. 5. 26.) 기고.