‘우리 것을 개방할테니, 너희것도 우리에게 개방해다오’

이는 다음의 검색철학을 짧게 설명한 문구라고 볼 수 있습니다. 다음이 내세우는 검색철학은 ‘웹의 공정성’이라는 부분이거든요.

다른 포털들의 콘텐츠를 비롯해 콘텐츠 프로바이더(CP)가 생산한 정보를 사용자들에게 잘 전달하겠다는 의지가 담겨있습니다.

반대로 자신들이 만들어둔 콘텐츠도 얼마든지 다른 포털들이 가져갈 수 있도록 조절을 하기도 합니다.

다음 박혜선 검색기획 팀장은 “검색이란 것은 사막에서 바늘찾기와 같습니다. 정형화돼 있지 않는 수많은 데이터에서 정답을 찾아주는 것을 의미하죠”라고 운을 뗐습니다.


박팀장은 조심스럽게 경쟁사의 이야기를 꺼냈습니다.

“구글과 네이버가 우수한 검색엔진을 가지고 있다는 사실은 어느누구도 부정할 수 없습니다. 그러나 방식은 다릅니다. 구글은 인터넷상에서 자신들이 긁어올 수 있는 모든 것들을 크롤링 해 기계적 알고리즘에 따라 노출시키지만 네이버는 자사데이터를 먼저 노출시킵니다. 이는 한국형 포털의 특징이기도 합니다“

앞서 2부에서 설명했듯이 네이버는 엄청난 자사데이터를 보유하고 있습니다. 블로그, 카페, 지식인 등 커뮤니티 콘텐츠를 비롯해 NHN이 직접 구축한 네이버캐스트가 바로 그것입니다.

네이버는 이미 한국사용자들에 입맛에 맞는 콘텐츠를 보유하고 있으며, 트렌드를 읽어가고 있기 때문에 자사데이터를 먼저, 많이 노출하고 있습니다.

다음 역시 자사데이터를 다량 보유하고 있으나 네이버보다는 다소 부족하다고 합니다.

박 팀장은 “검색결과에 노출되는 자사데이터와 타사데이터 비율을 생각해봅시다. 네이버의 경우 8대 2정도라고 생각됩니다. 그만큼 한국인들의 성향에 맞는 데이터가 있다는 의미죠. 다음은 5대 5정도의 비율을 가지고 있습니다. 각각 절반의 데이터를 노출시키는 전략은 저희만 쓰고 있을 겁니다”라고 설명합니다.

최근 다음에서 하는 고민은 ‘한국의 웹 생태계를 위해 우리는 어떠한 것을 해야할까’라는 부분이라고 합니다.

회사의 이윤도 중요하지만 검색엔진이라는 것에 맞게 사용자들이 원하는 답을 제시해줄 수 있기 위해서는 선순환하는 생태계가 필요하다는 것입니다.


“자사의 데이터를 위주로 검색결과를 보여주는 것은 제대로 된 검색이라고 할 수 없습니다”

자사 데이터를 우선시하면 당장 트래픽은 높아질 수 있으나 장기적인 안목에서 보면 마이너스가 될 것이라는 주장입니다.

박 팀장은 “외부데이터를 다음에서 검색되도록, 또한 우리의 데이터를 구글, 네이버에서 검색되도록 만드는 것이 다음 검색팀의 지향점입니다”라고 말합니다.

한가지 궁금한점이 생겼습니다. 인터넷상에는 무수히도 많은 데이터가 있고 당연히 중복된 데이터도 있을 것입니다.

콘텐츠를 만드는 사람의 입장에서는 자신이 만든 콘텐츠가 검색되길 바라지, 남이 자신의 콘텐츠를 무단으로 퍼간 것이 검색되는 것을 원하지 않을 것입니다.

즉, 검색엔진들은 중복판정을 어떻게 할 것인가? 라는 의문이 들었습니다.

오히려 박 팀장이 제게 물어봅니다.


“원본을 찾는 것은 사실 매우 어려운 일입니다. 또한 찾는다고 하더라도 우리나라 사람들은 원본보다는 ‘최신글’을 보고싶어 하는 성향이 강해서 조율하기가 매우 힘듭니다. A라는 게시물이 2002년에 올라왔습니다. A라는 게시물을 베이스로 추가적인 코멘트를 달았다면 기자님은 어떤 것을 상단 배치하실겁니까”

선뜻 대답하지 못했습니다. 정말 고민이 됐습니다. 원본글도 중요하지만 해당 원본글에 최근에 추가된 새로운 팩트가 들어가 있다고 가정할 때, 사용자가 원하는 것이 무엇일지.

여러분은 어떻게 하시겠습니까?

2011/10/05 09:41 2011/10/05 09:41

트랙백 주소 :: http://kiku.delighit.net/trackback/103