'아카데미 인사이트'는 석박사 과정의 전공자들이 직접 미디어, 커뮤니케이션, 마케팅 분야의 연구(논문)를 요약ㆍ소개해 업무에 바쁜 홍보인과 마케터들에게 인사이트와 아이디어를 제공한다.  

2016년 미국 대통령 선거 당시 페이스북(Facebook, 현 Meta)이나 트위터(Twitter) 등 소셜미디어에서 양산되는 가짜뉴스 모두 기억하시는가요? 대선 당시 러시아 정보기관이 도널드 트럼프 전 대통령에 우호적인 방향으로 인터넷 여론을 조작하여 선거에 영향을 미치려 한 시도가 있었다.

해당 사건은 인터넷상의 정보가 특정한 조직과 이해관계에 의해 얼마나 쉽게 오염되고 왜곡될 수 있는지  보여주는 사례가 되었다.  동시에 인터넷 상의 왜곡된 정보는 반대 진영을 공격하는 ‘무기’로 활용되어 저널리즘과 민주주의에 대한 전례 없는 위협으로 떠오르게 되었다.

오늘날 팩트체킹에 대한 논의는 이같은 정보의 위기 상황에서 유력한 대안으로 부상하였다. 디지털 환경에서 생산되는 지식과 정보의 양이 방대해짐에 따라 그 안에서 어떻게 사실과 진실을 분별하느냐가 중요한 시대적 과제가 되었다.

클릭 한 번이면 자신과 연결된 수백, 수만의 이용자에게 허위정보를 공유할 수 있게 된 상황에서, 인공지능 기반 자동화 팩트체킹은 복잡한 미디어 환경 속에서 가장 유력한 대안 중 하나로 관심을 모으고 있다.

하지만 증가하는 팩트체킹 인공지능 기술개발의 필요성에 대한 인식에도 불구하고 실제 국내에서 인공지능 팩트체크 기술의 발전 수준과 역할은 답보 상태에 머물러 있다.

이미지=게티이미지뱅크
이미지=게티이미지뱅크

실시간 검증 가능한 AI, 한계도 있어

현재 국내 인공지능 팩트체킹 기술은 다른 인공지능 기술에 비해 가시적인 성과를 거두지 못하고 있기에, 그 이유와 당면한 과제는 무엇일까?

△  데이터 환경 육성의 필요성

첫째, 가짜뉴스 생산 및 배포되는 속도와 여기에 대응하는 팩트체크 기술 사이에 여전히 큰 간극이 존재한다. 이는 오늘날 디지털 인프라도 점차 확장되고 세밀해져 가짜뉴스를 유통하고 배포하는 과정에서 정책적으로나 기술적으로 개입하고 통제하기도 버거워지고 있기 때문이다.

특히 세계 각지의 여러 기관과 비교하면 데이터 환경 관련 연구나 사회적 관심도가 현저히 부족하기에, 이에 대한 문제의식을 갖고 다방면의 노력이 필요하다.

△ 저작권 문제와 한국어 데이터 부족 문제

둘째, 연구에 활용할 만한 정제된 대용량의 한국어 데이터가 부족하다. 한국형 팩트체킹 인공지능 모델은 방대한 양의 ‘사실 검증이 완료된’ 한글 데이터셋을 통한 학습이 요구된다. 그러나 현재 국내 대부분의 사전 콘텐츠는 ‘저작권법’에 의해 보호되는 저작물로 연구 목적의 자유로운 이용에 제한이 있다.

“인공지능을 활용한 팩트체킹 같은 경우에는 저희가 지금 계속 데이터를 수집하고 분석하고 데이터를 수집해서 학습용 데이터를 만들고 이런 작업들을 거쳐왔는데 그 과정에서 이제 저작권 문제라든가 데이터 학습용 데이터의 퀄리티 문제 이런 거에 따라서 결과에 많이 영향을 미치는거를 보아왔어요…(중략)...근데 이게 여러 가지 이유가 있을 수있는데 아마 단순 사실 같은 것들보다 과학적인 사실이 한국어 위키피디아에 좀 너무 없어서 문장이 많이 학습되지 않아서 이럴 가능성도 있어요…(중략)...그 문장이 두 문장 이상 정도 되면은 그런 문제들이 발생할 수가 있어서 사실 저희가 지금은 아직그 두 문장 이상의 주장을 판별해내지는 못하고 있어요. (SNU 팩트체크센터 담당자)”

△ ‘팩트’체킹의 정치화

셋째 가짜뉴스는 ‘사실 개념의 차이’, ‘사실 자체가 갖는 인식론적 불명확성’, ‘사실 확인에 개입하는 주체들 간의 역학관계’ 문제와 얽혀있다.  문제는 가짜뉴스와 팩트체크 관련 의제가 건전한 사회적 논의의 장을 형성하기보다는 '정치화' 되는 경향이다. 

“그 AI를 지원하고자 하는 욕망이라고 하는 건 사람이 했을 때의...선택 편향...같은 걸다 피해갈 수 있을 거라고 생각하는 그런 욕망이 있는 것 같아요...(중략)...우리가 다루고 있는 문제가 사회적인 문제잖아요...피지컬한 세상을 다루는 것이 아니기 때문에 그런 것들은 기본적으로 가치 배제된 채로 볼 수 없는 문제들이 많이...(SNU 팩트체크센터 담당자)”

검증대에 오른 ‘팩트’들은 객관적 증명을 요구하는 과학적 사실보다 주관적 가치 판단이 요구된다. 결국 팩트체크는 사실 여부에 대한 검증보다는 사실성에 근접한 ‘함의’의 도출에 비중을 두게 된다.

앞서 언급했듯이 정보의 오염 현상, 즉 가짜뉴스는 명확한 정의가 없고, 개념적으로 여러가지 문제가 얽혀있다. 이러다 보니 학계가 가짜뉴스 해소를 위해 노력하고 있지만 정치권을 중심으로 ‘가짜뉴스’ 용어가 남용되고 있다.

팩트채킹 전반에 대한 건강한 사화적 공론의 장 필요

인공지능이 가짜뉴스 생산 및 확대 재생산에 악용될 경우, 정당한 출처를 가장해 정교한 가짜 영상을 만들어 내 '없었던 일'을 사실로 만들어버릴 수도 있다. 이는 전에도 있었던 일이지만 인공지능으로 인해 더욱 정교화될 수 있다. 

이에 오늘날 인공지능을 활용한 가짜뉴스와의 전쟁, 가짜뉴스 생산에 인공지능이 악용될 위험성, 인공지능 저널리즘의 윤리적 차원에서의 풍부한 논의가 필요하다.

결론적으로, 팩트체크는 사실 판정으로 완료되는 것이 아니다. 끊임없는 합의의 과정정이 필요하다. 어떻게 하면 팩트체크 과정을 사회적인 선순환 과정으로 정착시킬 수 있을지에 대해 고민이 동반되어야 한다.

팩트체킹 기술을 넘어 팩트체킹 영역 전반을 아우르는 건강한 사회적 공론장 형성이 필요하다. 

저작권자 © 반론보도닷컴 무단전재 및 재배포 금지