본문 바로가기
수익형 블로그/IT 인터넷 팁

네이버 검색 로직의 변천사

by 낭만쉼표 2020. 5. 28.
반응형

뭔가 정확한 정보를 검색할 때 구글에서 찾는 것은 10대부터 40대 사이에서는 이미 어느 정도 보편적인 상식으로 자리 잡았습니다. 왜 많은 사람들이 이른바, 국민 검색엔진이라 할 수 있는 네이버가 아닌 구글을 이용하고 있을까요? 지난 2016년 7월 새롭게 C-RANK 알고리즘이 등장하기 전까지만 해도, 네이버 검색 결과는 온라인 광고회사들의 놀이터나 마찬가지였습니다. 저 역시 2010년대 초반만 해도 네이버 검색을 하면 대부분 광고를 보는 것 같아 시간낭비라고 생각했을 정도 였습니다.

 

 

하지만 네이버가 그냥 놀고만 있었던 것은 아닙니다. 조금 과장을 하면 네이버 검색엔진의 역사는 곧 네이버의 역사라고 봐도 될 만큼, 생존을 위해 끊임없이 많은 노력을 해왔습니다. 네이버 검색엔진에 적용되고 있는 검색 로직 역시 수차례 바뀌었습니다. 이 검색 로직들이 때마다 바뀐 데는 모두 합리적인 이유가 있었습니다. 우리는 이 이유들을 정확히 알아야 상위반영에 대한 원리를 이해할 수 있습니다.

 

인터넷에는 다양한 정보들이 존재합니다. 흔히들 네이버 검색 로직이라 부르는 네이버 검색 알고리즘은 웹문서에 담겨있는 정보를 일정한 기준으로 점검한 뒤, 이를 검색결과에 반영합니다. 우리는 여기서 3가지 아주 중요한 의문을 가질 수 있습니다. 네이버 검색 로직은 도대체 ① 어떤 기준을 가지고, 정보를 ② 어떻게 판단할까? 그리고 이 판단된 정보는 ③ 검색결과에 어떤 식으로 반영될까입니다.

 

네이버 검색 로직의 역사

① 초창기 (2003년 ~ 리브라 도입전)

1997년에 설립된 네이버는 초기에는 단순한 인터넷 검색업체였지만, 2002년 지식in 서비스를 시작으로 사업영역을 획기적으로 전환할 수 있었습니다. 일단 모르는 게 생기면 인터넷 검색창에 쳐봐야겠다는 생각이 들도록 사람들의 인식을 변화시켰기 때문입니다. 이어서 2003년에 런칭한 블로그 서비스 역시 대박행진의 연속이었습니다. 블로그(Blog)는 웹(Web)과 기록(Log)가 합쳐진 단어로서, 당시 주류였던 싸이월드 미니홈피의 대항마로 급성장했습니다. 지금은 사용자 편의성이 굉장히 높은 네이버 블로그도 초창기에는 싸이월드의 아기자기한 느낌과 경쟁하기 위해 뭔가 전문성있는 듯한 분위기를 연출하는데 집중했던 것으로 기억됩니다.

 

 

네이버 지식in을 통해 전환된 소비자의 인식과 함께 네이버 블로그가 갖고 있는 뭔지 모를 전문성을 통해 2000년대 중후반은 블로그 후기글이 소비를 사실상 좌지우지하는 상황에까지 이르렀습니다. (이때 파워블로거의 위상은 정말 대단했습니다.) 그러다 보니 수없이 많은 광고업체들이 이 시장에 뛰어들게 되었고, 도배된 광고성 글들로 인해 블로그는 이제 더이상 순수하지 않다고 믿는 사람들이 점차 늘어나기 시작했습니다.

 

② 리브라(LIBRA) 알고리즘 (2012년 ~ 소나 도입전)

수많은 온라인마케팅 광고업체들이 키워드를 선점하며, 블로그를 통해 광고를 남발하자 드디어 2012년에 도입된 것이 바로 리브라 로직입니다. 리브라 로직은 블로거의 성실함과 사용자 반응에 집중했습니다. ⓐ 45일간 매일 포스팅을 진행할 경우, 최적화된 블로그로 인정하고, ⓑ 사용자 반응의 일종인 댓글과 스크랩 수가 많은 블로그 포스팅을 검색결과 상위에 반영시켰습니다.

 

아마 네이버 측에서는 리브라 로직이 나름 괜찮아 보이는 대책이라고 생각했거나 혹은 당시로서는 이 이상의 기술력을 갖추고 있지 않았기 때문에 어쩔 수 없이 도입했을거라 추측됩니다. 나름의 진입장벽이 생겼기에 오히려 이때를 기점으로 최적화 블로그를 대량생산하는 공장이 생겨났고, 45일을 기다릴 수 없는 소비자는 이를 구매하기 시작했습니다. 포스팅의 질(quality)과 상관없이 45일 동안 단순하게 1일 1포스팅만 하면 최적화 블로그가 됐기에, 업체 측에서는 이를 대량생산하기 위해 같은 글을 반복적으로 올리는 어뷰징 행위를 적극적으로 했습니다.

 

③ 소나(SONAR) 알고리즘 (2013년 ~ C-RANK 도입전)

너무 단순했던 리브라 로직 때문에 오히려 유사문서들이 확산되면서, 검색결과에 대한 신뢰도는 예전보다 더욱 하락하게 되었습니다. 이런 문제를 보완하기 위해 1년 뒤에 도입된 것이 바로 소나 로직입니다. 소나는 원래 해양환경탐지에 사용되는 초음파 시스템인데, 이런 특성을 착안해 원본문서를 제외한 유사문서들을 걸러내기 위해 도입되었습니다.

 

하지만 소나 로직은 리브라 로직의 연장선상에 있었기 때문에 여전히 많은 문제점을 안고 있었습니다. 예를 들어 현재는 검색옵션에서 정렬을 관련도순과 최신순으로 설정할 수 있지만, 이때까지만 해도 아직 정확도순과 최신순으로 설정되었습니다. 즉, 단어 자체의 정확도에만 매몰되어, 전반적인 글의 맥락과 전혀 상관없는 포스팅들이 빈번히 상위반영되고 있었던 것입니다. 물론 소나 로직은 네이버 측이 본격적으로 어뷰징 행위를 잡아내기 시작했다는 점에서 나름 의미있는 시도였다고 생각합니다.

 

④ C-Rank 알고리즘 (2016년 7월 ~ 현재)

네이버 측에서 정말 칼을 갈고 준비한 검색 로직이 바로 C-RANK 로직입니다. 워낙에 질이 떨어지는 블로그 포스팅이 많다 보니 포스팅 자체에 대한 단속보다는 아예 포스팅을 발행하는 블로거에 집중했습니다. 즉, 신뢰도와 인기도가 높은 블로거(creator)가 올린 블로그 글을 우선적으로 상위반영하겠다는 것입니다.

 

신뢰도와 인기도가 높은 블로거가 되기 위해서는 전문성 있는 포스팅을 꾸준하게 발행해야만 했습니다. 최대한 쉽게 설명하면, ⓐ 해당 블로그의 주제별 집중도가 얼마나 높은지(context), ⓑ 생산된 포스팅의 질이 얼마나 좋은지(content), ⓒ 생산된 포스팅으로 인해 어떤 반응이 일어나는지(chain)를 평가해, 이를 바탕으로 블로거(혹은 해당 블로그)에 대한 신뢰도와 인기도를 판단했습니다.

 

 

결론부터 얘기하면, C-RANK 도입은 굉장히 현명하고, 올바른 선택이었습니다. 그렇기에 실제 C-RANK 로직은 현재까지도 검색 결과에 영향을 주고 있습니다. 이때를 기점으로 파워블로그 제도가 사라졌으며, 대신 각 분야의 전문성을 갖춘 블로그들, 예를 들어 IT 블로그, 맛집 블로그 등이 등장하기 시작했습니다. 광고를 위해 인위적으로 생산됐던 수많은 블로그들이 저품질 선고를 받고 퇴출됐습니다. 다만, 단순 일상글을 올리던 블로그나 다양한 관심사를 가지고 운영되던 블로그 역시 C-RANK 로직 하에서는 좋은 평가를 받을 수 없다는 점은 현재까지도 꽤나 민감한 이슈이기도 합니다.

 

C-RANK 로직만큼은 네이버가 정말 치열하고 깊이있는 고민을 했다는 것이 절절하게 느껴집니다. 가장 혁신적이라 생각했던 부분은 검색옵션에서 정렬을 기존 정확도순과 최신순에서 관련도순과 최신순으로 바꿨다는 점입니다. 즉, 키워드, 그 글자 자체의 정확성이 아닌 키워드와 본문과의 상관관계를 높게 평가하겠다는 것입니다. 이때부터 ⓐ 글자수 1,000자 이상, ⓑ 사진 3장 이상, ⓒ 키워드 반복 5회 이상 등과 같은 각종 포스팅 팁들이 난무하게 되었습니다.

 

하지만 C-RANK 로직은 블로그 진입장벽을 단숨에 너무 높게 만들어 버렸다는 비판이 불거져 나왔습니다. 일부 키워드의 경우, 기존에 신뢰도와 인기도가 높은 블로거의 포스팅이 1페이지에 많게는 7~8개나 차지해 버리는 독점현상이 나타나기 시작한 것입니다. 신규 블로거의 경우, 기존 고인물(?) 블로거의 블로그 지수가 워낙 높기 때문에 아무리 노력해도 검색 상위반영이 절대 불가능했습니다. 이에 따라 네이버 블로그가 점차 몇몇 소수 블로거들만의 무대로 변하려 할 쯤, 새로운 로직이 추가됩니다.

 

⑤ D.I.A 알고리즘 (2018년 6월 ~ 현재)

D.I.A(Deep Intent Analysis) 로직, 일명 다이아 로직은 가장 최근에 적용된 검색 로직으로서, 현재 C-RANK 로직과 함께 병행해서 적용되고 있습니다. 실제로 C-RANK 로직으로 출처인 블로그 자체를 판단하고, 다이아 로직으로 포스팅을 판단한 뒤, 이를 종합해서 검색결과에 반영하고 있습니다. 즉, 신뢰성과 인기도가 높은 출처와 함께 좋은 콘텐츠인지의 여부가 중요한 판단기준이 된 것입니다.

 

 

​양질의 포스팅인지를 판단하는 기준으로 체류시간을 중요하게 여기고 있습니다. 일반적으로 좋은 콘텐츠는 방문자들이 오랜 시간에 걸쳐 보는 경향이 있기 때문입니다. 또한 이전에는 정보 그 자체만을 고집했다면, 다이아 로직은 진실이 포함된 상세한 후기 형식을 좋게 평가하고 있습니다. 따라서 비록 누적된 포스팅들이 없어 C-RANK 로직상 좋은 평가를 받지 못하더라도, 위 기준에 적합한 포스팅은 다이아 로직상 높은 평가를 받아 상위반영이 가능하게 되었습니다. 즉, 신규 블로거도 이제는 좀 더 쉽게 네이버 블로그를 시작할 수 있게 된 것입니다.

 

앞으로 우리는 어떻게 해야 될까요?

네이버 검색로직의 변천사를 깊이 있게 공부하는 과정에서 느끼게 된 바가 정말 많습니다. 많은 분들이 말씀하셨듯이 수익형 블로그를 운영하기 위해서는 상위반영의 원리를 익혀야 된다는 점에는 정말 전적으로 동의합니다. 어차피 컴퓨터 프로그램이 이를 관리하고 있는 만큼, 좋은 글에 대한 기준이 있을 것이고, 그 기준에 부합되는 포스팅을 기계적으로 상위반영시키는 것이 이 프로그램이 운영되는 목적이기 때문입니다.

 

하지만 진짜와 가짜를 구별해내는 기술은 날로 발전될거라 예상됩니다. 따라서 장기적으로는 좋은 콘텐츠를 제작할 수 있는 능력 자체를 갖추는 것이 정말 중요하다고 생각합니다. ① 시의성을 갖춘 탄탄한 기획력, ② 독자들이 편안하게 포스팅에 몰입할 수 있게 만드는 글쓰기 능력, ③ 현상 너머의 의미를 포착할 수 있는 사진촬영기술, 마지막으로 ④ 원활한 포스팅을 할 수 있도록 도와주는 각종 툴을 다룰 수 있는 기술 등이 양질의 콘텐츠를 제작하는 데 필요한 능력들입니다. 우리는 콘텐츠 크리에이터가 되도록 노력해야 됩니다. 지엽적으로 상위반영하는 것 자체에 매몰되다 보면, 각종 증명되지 않은 팁들을 찾아다니며, 일희일비하기 십상입니다.

반응형

댓글