아카데미 인사이트'는 석박사 과정의 전공자들이 직접 미디어, 커뮤니케이션, 마케팅 분야의 연구(논문)를 요약ㆍ소개해 업무에 바쁜 홍보인과 마케터들에게 인사이트와 아이디어를 제공한다.  

2022년 6월, 시민단체 <정치하는 엄마들>은 포털 사이트에서 일상적인 단어를 검색해도 ‘성적이고, 성편향적이며, 성차별적인 이미지’가 노출되는 것을 발견하였으며 이에 대해 문제제기 및 캠페인을 실시하였다.

2022년 9월, <정치하는 엄마들>은 캠페인을 통해 수집된 문제의 단어들을 명기하여 검색어와 이미지 삭제를 요청하는 공문을 네이버 측에 발송했다. 이를 기점으로 네이버는 이 중 일부 단어들의 이미지 검색 결과를 즉각 수정했지만 어떠한 반응이나 설명이 없었다.

본 논문은 알고리즘의 변경이 특정한 원리 원칙에 의해 이루어진 것이 아니라 자의적으로 아무런 설명 없이 이루어지고 있다는 점을 지적하고 있다. 물론 시민단체가 제기한 선정성 문제에 대해 네이버측은 즉각 대응했다. 그러나 제기된 검색어 중 일부만 수정하였으며 이러한 과정에서 선택과 조치에 대한 구체적 설명 없이 진행했다는 점에 대해 본 논문은 알고리즘 책무성과 관련하여 문제를 제기하고 있다.

한편, 연구진들은 시민단체의 보도자료 발표 이전부터 알고리즘 관한 현상을 주시하면서, 관련 검색어와 이미지 데이터를 ‘스크린샷 저장’, ‘스크래핑’, ‘네이버 API’를 활용하여 수집하고 있었다. 분석결과, 시민단체가 제기한 문제 검색어 목록에 있던 단어들 중 일부는 이미지 검색 결과가 변경되었음을 발견하였다.

구체적으로 연구진이 검증한 이미지 검색 결과의 변경 패턴은 검색어에 따라 해당 단어가 포함된 ① ‘복합 검색어 대체’, ② ‘유사 단어(어구)로 대체’, ③ ‘자동완성 서비스가 제공하는 검색어 대체’로 유형화하였다.

복합 검색어로의 검색어 대체

첫 번째 변경 패턴은 ‘복합 검색어 대체’ 방식으로, 이는 결과값을 변경하기 위해 기존 검색어에 특정 단어를 추가시켜 검색되도록 수정하는 방식이다. 예를 들어, 길거리’ 검색 시 남성도, 겨울도, 아이도, 노인도 없었다. 그러나, 언론보도 이후 바뀐 이미지 결과에서는 모두 하나같이 양쪽에 건물이 늘어서 있고, 그 가운데 도로가 소실점을 향해 뻗어있는 구도의 이미지로 대체되었음을 발견하였다. 연구진들이 제목 태그를 확인한 결과, 모든 태그에 ‘사진’이라는 단어가 공통적으로 들어있는 것을 확인했다.

다시 말해, ‘길거리’를 검색하면 자동으로 ‘길거리 사진’이란 검색결과가 나오게 변경된 것이었다. 이처럼 ‘레이싱’이 ‘레이싱 경기’로, ‘모델’이 ‘패션 모델’로 바뀐 결과값을 노출시키며, 복합 검색어를 활용하여 알고리즘을 변용하고 있었다.

출처: 네이버 ‘길거리’ 이미지 검색결과
출처: 네이버 ‘길거리’ 이미지 검색결과

유사어 검색 결과로의 대체

두 번째 변경 패턴으로 보이는 방법은 ‘유사어 검색 결과로 대체’하는 방식이다. 이는 검색 결과에 나오는 이미지들을 아예 다른 검색어 이미지 결과로 조정하여 바꾸는 방식으로, 연구진들은 복합어 검색보다 조정자의 의도나 편향이 더 많이 반영될 수 있는 변경 방식이라고 주장하였다. 예를 들어, ‘아찔’이라는 검색어는 ‘아찔한 곳’이라는 검색어로 대체되었다.

두 번째 변경 패턴으로 보이는 방법은 ‘유사어 검색 결과로 대체’하는 방식이다. 이는 검색 결과에 나오는 이미지들을 아예 다른 검색어 이미지 결과로 조정하여 바꾸는 방식으로, 연구진들은 복합어 검색보다 조정자의 의도나 편향이 더 많이 반영될 수 있는 변경 방식이라고 주장하였다. 예를 들어, ‘아찔’이라는 검색어는 ‘아찔한 곳’이라는 검색어로 대체되었다.

출처: 네이버 ‘아찔’ 이미지 검색결과
출처: 네이버 ‘아찔’ 이미지 검색결과

자동완성 검색어 대체

세 번째 변경 패턴은, 자동완성 기능이 생성하는 목록 1순위 검색어를 활용하는 것이다. 굳이 새로운 단어 조합을 만들거나 유사 검색어를 찾기보다 데이터를 활용하는 방식이다. 여기서 주목할 점은 이미지 검색 결과를 의도적으로 바꾸기 위해 데이터를 활용하는 것이지, 데이터를 그대로 반영하는 것이 아니라는 점이다. 예를 들어, ‘호불호’의 이미지를 입력하면 자동완성기능으로 생성되는 검색어들 중 1순위에 해당하는 ‘호불호 갈리는 음식’의 이미지로 대체된다.

출처: 네이버 ‘호불호’ 이미지 검색결과
출처: 네이버 ‘호불호’ 이미지 검색결과

앞서 제시한 예시들을 살펴보면, 네이버는 이미지 검색 결과의 일부 변경하였는데, 전체적인 검색 알고리즘을 변경한 것이 아닌 콘텐츠의 가시성(visibility)을 조절하는 방식으로 변경하였다. 일부 검색어에 한해서만 다른 결과가 나오도록 알고리즘 운영방식으로, 예를 들어 입력된 검색어를 다른 검색어로 대체하거나 필터를 사용하여 특정 결과가 검색에 걸리지 않도록 하였다.

논문에서 지적된 네이버의 이러한 태도는 플랫폼을 넘어선 다양한 차원의 논의의 필요성으로 이어진다. “‘정치하는 엄마들’이 캠페인을 벌이지 않았다면, 혹은 보도자료를 언론이 보도하지 않았다면 알고리즘은 수정되었을까?”, “다른 개인이나 집단이 문제제기하면 알고리즘은 언제든지 바뀔 수 있는가?”, “요청을 수용하여 수정되면 모든 문제는 해결되는 것인가?”, 무엇보다 근본적인 질문인 “검색결과 이미지들을 조정하고 바꾸는 것은 누가 정하는가?”라는 질문을 할 수 있다.

더 나아가, “이미지 검색 결과에서 공문에 의해 검색 결과가 바뀌는데 뉴스 서비스는 그렇지 않다는 보장이 어디에 있는가?”라는 문제제기를 할 수 있다. 앞서 언급한 바와 같이 알고리즘에서 특정한 부분만 바꾸는 것이 가능하다는 것을 수용자들이 알게 된 셈인데, 이미지 검색 외에 다른 서비스는 그렇지 않다는 보장도 없다고 바라보고 있다.

진일보한 알고리즘 책무성 실천을 위하여

실제적으로 알고리즘 책무성을 실천하기 위해서는 사회적으로 문제가 제기된 사항에 대해 공론화될 수 있는 경로를 만들고 책무성을 수행할 필요성이 있다. 알고리즘 개편과 관련. 네이버는 개편 사실을 알리지 않고 검색 결과를 자사에 유리하게 나오도록 했다는 의심 사례도 있을 만큼 개편의 투명성을 기반으로 한 책무성에 대해 지적받아 왔다.

알고리즘 책무성은 알고리즘을 공개하고 원리를 설명하는 것에서 그치지 않고, 알고리즘으로 발생되는 상호작용과 거래·사건과 사고 등 과정과 결과를 살펴보아야한다. 따라서 본 연구에서 언급한 바와 같이 플랫폼 알고리즘 운영의 투명성과 알고리즘에 의해 나타나는 결과를 설명할 책무에 대해 다시 한번 생각해볼 필요가 있다.

저작권자 © 반론보도닷컴 무단전재 및 재배포 금지