[딜라이트닷넷 창간 2주년/검색에도 철학이 있다]③ 싸이월드의 감성을 네이트에 녹이다

“싸이월드의 감성 콘텐츠를 네이트에 녹일 수 있는 방향을 고민하고 있습니다”

국내 포털업체 중에 유일하게 독보적인 길을 걷고 있는 SK커뮤니케이션즈의 네이트.

독보적이라고 말할 수 있는 것은 네이버, 다음, 파란, 야후코리아, 구글코리아 등 주요 포털들이 검색결과를 콜렉션에 따라 분류하는 ‘통합검색’을 유지하는 반면 네이트는 시맨틱 검색을 전면으로 내세우고 있기 때문입니다.

네이트는 시맨틱 검색을 전면으로 내세우고 자신들이 보유한 싸이월드의 콘텐츠를 녹인다는 계획을 가지고 있었습니다.

네이트의 김상호 검색팀장은 “아직 확정된 것은 아니지만 싸이월드의 콘텐츠를 네이트 검색에서 확인할 수 있도록 할 계획이다. 물론 지난 7월 미니홈피 콘텐츠가 오픈되긴 했지만 좀 더 디테일한 기능을 준비하고 있다. 미니홈피에 올라와 있는 감성적인 콘텐츠(텍스트가 아닌)를 검색에서 확인할 수 있게되면 정말 매력적이지 않을까 생각하고 있다. 어차피 DB싸움으로는 한계가 있다. 우리는 사람과 사람사이 어떤 것들이 공유되고 있는지에 대해 고민하고 있다"라고 말했습니다.


 


가령 네이트에서 ‘첫사랑’이라는 검색어를 치면 내 1촌들이 첫사랑과 관련된 게시물들이 노출되는 식입니다. 두근두근했던 첫사랑의 추억부터, 이미지 등이 여기에 포함되겠죠.

네이트의 검색철학은 어떠할까요?

 

김 팀장은 이렇게 정의했습니다.

“사용자들이 검색을 하는 이유는 무엇이라고 생각하세요? 물론 자기가 알고 싶은 정보를 찾고싶어서 검색을 하겠지요. 그점에 있어서는 통합검색보다 시맨틱 검색이 더 사용자들에게 편리합니다.”

(자세한 이야기에 앞서 시맨틱 검색에 대해 간단히 소개하자면 하나의 검색어가 갖는 모든 의미를 하나로 묶어서 보여주는 것입니다. 가령 ‘아이유’를 검색했을 경우 ▲프로필 ▲    이미지 ▲최근뉴스 ▲실시간검색 ▲부른노래 등 사용자가 원하는 정보를 한눈에 보여줍니다. 통합검색이랑 유사한 UI를 가지고 있지만 본질은 상이합니다)

오히려 김 팀장은 ‘현재 포털을 사용하는 사람들이 정말 검색을 편하게 하고 있는가’라고 저에게 반문합니다.

“사용자들이 국내포털들이 제공하는 검색을 얼마나 편리하게 사용하고 있을까요? 날이면 날마다 수십, 수백만건의 정보가 축적되는 가운데 사용자가 정말 원하는 정보를 검색 한번에 찾을 수 있을까요?

저는 그렇지 않다고 봅니다. 통합검색의 경우 한 눈에 여러 출처의 콘텐츠를 확인할 수 있다는 장점은 있으나 결국 선별하는 것은 사용자의 몫입니다. 수십억건의 콘텐츠를 보여줄 수 없으니 기계적으로 분류된 몇 개의 콘텐츠만 사용자들은 보게 됩니다. 추가적인 정보가 필요할 경우 더 많은 수고를 필요로 하죠“

그의 주장에 따르면 기존 통합검색의 경우 검색어와 웹문서의 정확도를 매칭해서 노출하므로 사용자들의 검색의도를 읽지못한다는 것입니다.

반면에 시맨틱 검색은 해당 검색어가 어떤 의미를 가지는지 파악하고 관련된 내용을 함께 노출해 재차 검색하는 수고를 줄일 수 있다는 것입니다.


검색철학으로 들어가면 네이트는 외부데이터에 좀 더 많은 신경을 쓰고 있습니다. 내부데이터가 없어서 그런것은 아니지만, CP(콘텐츠 프로바이더)와의 상생을 위한 것이라고 하네요.

김 팀장은 “네이트 검색은 내부데이터보다는 외부데이터를 많이 노출시키려고 합니다. 굳이 대상을 따지자면 전문CP들이겠죠. 사실 DB싸움으로 나가서는 네이버나 다음을 따라갈 수 없는 것은 사실입니다. 우리는 전문CP들의 콘텐츠를 노출시킴과 동시에 외부블로거, 웹문서를 함께 노출시키는 전략을 사용하고 있습니다. 방송사와의 제휴가 좋은 예가 되겠네요”라고 설명합니다.

시맨틱이 우수하다는 것은 알겠는데, 막상 사용하는 사람이 없으면 말짝 도루묵 아니겠습니까? 그래서 과감하게 ‘어떻게 사용자를 확보할 것인가?’라는 질문을 던졌습니다.

그의 대답은 아래와 같습니다.

“모바일 검색이 대세로 떠오르고 있습니다. 통합검색이라는 프로세스는 모바일에 적합하지 않습니다.모바일에서는 정보를 뭉뚱그려서 확인하기 보다는 정말 필요한 ‘하나’가 중요하게 작용할 것입니다. 사용자의 의도를 읽을 수 있어야 한다는 것이죠. 그런 의미에서 시맨틱 검색은 모바일과 아주 잘 맞습니다.

당장 경쟁사를 쓰는 사용자들이 네이트로 오리라고 생각하진 않지만, 모바일은 너무나 빠르게 변하고 있어 조만간 변화가 오리라 생각됩니다”


2011/10/05 09:42 2011/10/05 09:42
‘우리 것을 개방할테니, 너희것도 우리에게 개방해다오’

이는 다음의 검색철학을 짧게 설명한 문구라고 볼 수 있습니다. 다음이 내세우는 검색철학은 ‘웹의 공정성’이라는 부분이거든요.

다른 포털들의 콘텐츠를 비롯해 콘텐츠 프로바이더(CP)가 생산한 정보를 사용자들에게 잘 전달하겠다는 의지가 담겨있습니다.

반대로 자신들이 만들어둔 콘텐츠도 얼마든지 다른 포털들이 가져갈 수 있도록 조절을 하기도 합니다.

다음 박혜선 검색기획 팀장은 “검색이란 것은 사막에서 바늘찾기와 같습니다. 정형화돼 있지 않는 수많은 데이터에서 정답을 찾아주는 것을 의미하죠”라고 운을 뗐습니다.


박팀장은 조심스럽게 경쟁사의 이야기를 꺼냈습니다.

“구글과 네이버가 우수한 검색엔진을 가지고 있다는 사실은 어느누구도 부정할 수 없습니다. 그러나 방식은 다릅니다. 구글은 인터넷상에서 자신들이 긁어올 수 있는 모든 것들을 크롤링 해 기계적 알고리즘에 따라 노출시키지만 네이버는 자사데이터를 먼저 노출시킵니다. 이는 한국형 포털의 특징이기도 합니다“

앞서 2부에서 설명했듯이 네이버는 엄청난 자사데이터를 보유하고 있습니다. 블로그, 카페, 지식인 등 커뮤니티 콘텐츠를 비롯해 NHN이 직접 구축한 네이버캐스트가 바로 그것입니다.

네이버는 이미 한국사용자들에 입맛에 맞는 콘텐츠를 보유하고 있으며, 트렌드를 읽어가고 있기 때문에 자사데이터를 먼저, 많이 노출하고 있습니다.

다음 역시 자사데이터를 다량 보유하고 있으나 네이버보다는 다소 부족하다고 합니다.

박 팀장은 “검색결과에 노출되는 자사데이터와 타사데이터 비율을 생각해봅시다. 네이버의 경우 8대 2정도라고 생각됩니다. 그만큼 한국인들의 성향에 맞는 데이터가 있다는 의미죠. 다음은 5대 5정도의 비율을 가지고 있습니다. 각각 절반의 데이터를 노출시키는 전략은 저희만 쓰고 있을 겁니다”라고 설명합니다.

최근 다음에서 하는 고민은 ‘한국의 웹 생태계를 위해 우리는 어떠한 것을 해야할까’라는 부분이라고 합니다.

회사의 이윤도 중요하지만 검색엔진이라는 것에 맞게 사용자들이 원하는 답을 제시해줄 수 있기 위해서는 선순환하는 생태계가 필요하다는 것입니다.


“자사의 데이터를 위주로 검색결과를 보여주는 것은 제대로 된 검색이라고 할 수 없습니다”

자사 데이터를 우선시하면 당장 트래픽은 높아질 수 있으나 장기적인 안목에서 보면 마이너스가 될 것이라는 주장입니다.

박 팀장은 “외부데이터를 다음에서 검색되도록, 또한 우리의 데이터를 구글, 네이버에서 검색되도록 만드는 것이 다음 검색팀의 지향점입니다”라고 말합니다.

한가지 궁금한점이 생겼습니다. 인터넷상에는 무수히도 많은 데이터가 있고 당연히 중복된 데이터도 있을 것입니다.

콘텐츠를 만드는 사람의 입장에서는 자신이 만든 콘텐츠가 검색되길 바라지, 남이 자신의 콘텐츠를 무단으로 퍼간 것이 검색되는 것을 원하지 않을 것입니다.

즉, 검색엔진들은 중복판정을 어떻게 할 것인가? 라는 의문이 들었습니다.

오히려 박 팀장이 제게 물어봅니다.


“원본을 찾는 것은 사실 매우 어려운 일입니다. 또한 찾는다고 하더라도 우리나라 사람들은 원본보다는 ‘최신글’을 보고싶어 하는 성향이 강해서 조율하기가 매우 힘듭니다. A라는 게시물이 2002년에 올라왔습니다. A라는 게시물을 베이스로 추가적인 코멘트를 달았다면 기자님은 어떤 것을 상단 배치하실겁니까”

선뜻 대답하지 못했습니다. 정말 고민이 됐습니다. 원본글도 중요하지만 해당 원본글에 최근에 추가된 새로운 팩트가 들어가 있다고 가정할 때, 사용자가 원하는 것이 무엇일지.

여러분은 어떻게 하시겠습니까?

2011/10/05 09:41 2011/10/05 09:41
[딜라이트닷넷 창간 2주년/검색에도 철학이 있다]⑥ 구글, 완벽한 검색엔진을 꿈꾸다

[IT전문 미디어 블로그=딜라이트닷넷]


검색엔진을 개발하는 실무진들은 언제나 ‘완벽한 검색엔진’을 꿈꾼다고 합니다.

완벽한 검색엔진이라는 것은 회사의 철학에 따라 다소 상이할 수 있지만 ‘사용자가 원하는 검색결과를 보여주자’라는 것은 모두가 인정하는 부분일 것입니다.

구글도 이와 같습니다.

구글 최고경영자(CEO) 래리 페이지는 “완벽한 검색 엔진이란 사용자가 뜻하는 바를 정확히 이해하고 원하는 결과를 정확하게 제공하는 엔진”이라고 정의합니다.

이를 위해 구글은 기술 혁신을 지속적으로 추구하고 기존 모델의 한계를 극복하고자 독자적인 검색기술을 개발했습니다. 구글이 내세우는 검색기술은 페이지랭크(PageRank)라는 기술입니다. 이는 웹의 전체 링크 구조를 검토하고 어떤 페이지가 가장 중요한지 결정합니다.

그런 다음 하이퍼텍스트 매칭 분석을 통해 진행 중인 특정 검색에 어떤 페이지가 가장 관련성이 높은지 결정합니다. 전체적인 중요도와 검색어별 관련성을 모두 고려해 가장 관련성이 높고 신뢰할만한 결과를 제일 먼저 게시하게 됩니다.

하나의 검색어에 따른 검색결과는 전무 기계적 알고리즘에 의해 노출됩니다. 수작업이 없다는 것이 구글의 특징 아닌 특징이지요.


사용자들이 어떤 검색어를 입력해 어떤 웹페이지를 클릭하는지 집계하고 이를 통해 중요도를 평가합니다.

중요도가 높은 웹페이지를 상단에 배치하는 것. 그것이 구글의 랭킹 알고리즘입니다. 물론 구글의 랭킹 알고리즘이 이렇게 간단하게 설명할 수는 없지만 대략적인 시스템은 이러하다고 생각하시면 됩니다.

(이러한 기계적 알고리즘으로 인해 검색결과 조작이나 유료게재와 같은 소문이 없는 것이겠지만, 과거 마이크로소프트 빙의 검색엔진 기술을 차용했다는 루머가 나오기도 했습니다)


해외 검색엔진 시장에서는 독보적인 1위를 차지하는 구글이지만 그러나 국내에서는 한자리수의 점유율에 그칩니다.

이를 극복하기 위해 구글코리아에서는 국내 포털사이트의 형태로 구글코리아 사이트를 개편한 바 있지만, 큰 성과는 이루지 못했습니다.

이는 국내 사용자들이 통합검색에 익숙해져 있고, 국내 포털사이트들은 국내 특화 콘텐츠를 다양하게 보유하고 있기 때문입니다.

반대로 구글에서는 전문자료를 비롯한 웹문서가 국내포털에 비해 풍부하다는 장점이 있지요.

끝으로 구글이 내세우는 웹에 대한 10가지 철학을 소개하며 마치고자 합니다.

1. 사용자에게 초점을 맞추자
2. 한 분야에서 최고가 되자
3. 느린 것보다 빠른 것이 낫다
4. 웹 민주주의는 지켜져야 한다
5. 데스크탑에서만 검색이 가능한 것은 아니다
6. 부정적인 방법을 쓰지 않고도 돈을 벌 수 있다
7. 정보는 무한대다
8. 정보 요구에는 국경이 없다
9. 꼭 정장을 입어야만 진지하게 업무에 임하는 것은 아니다
10. 최고에 만족하지 말자

세계의 절반 이상을 정복한 구글, 우리나라 포털업체들이 이를 견제하며 함께 성장하길 바랍니다.

[이민형 기자 블로그=인터넷 일상다반사]

2011/10/04 15:55 2011/10/04 15:55