세계 최고의 시맨틱 검색엔진 시맨틱스 Qrobo

블로그 이미지
백조가 된 미운 오리 새끼 이야기를 다 아시죠? 그동안 한국의 IT업계에서 검색엔진이라고 하면 미운 오리 새끼와 다름 없었습니다. 초대형 포털 사이트들이 탄생했지만, 그들은 자신들의 입지를 굳히기에만 급급했을 뿐, 사용자들에게 새로운 웹환경을 열어줄 의미기반 검색기술을 개발하는 데는 매우 인색했습니다. 거의 투자를 하지도 않을 뿐더러 그 새로운 시장의 전망에 전혀 기대를 걸지 않았습니다. 하지만 이제는 시맨틱스가 그 새로운 시장을 열어 갑니다.
by 시맨틱스
  • 7,511Total hit
  • 1Today hit
  • 0Yesterday hit


최근 미국의 한 유명한 디지털 비즈니스 마케팅 전문가가 웹 2.0 정상회의(Web 2.0 Summit)에 참석하고 돌아와서 자신의 블로그에 올린 글에 현재의 웹에는 진정한 혁신이 결여되어 있다 질타한 적이 있다. 아마도 누구나 2.0 말하고, 시맨틱 웹에 대해 논하는 시대에 진정한 시맨틱 기술을 구현하는 기업은 나오지 않고 오로지 조금만 신기술이 있고 자신에게 위협이 되겠다 싶은 기업이 있으면 얼른 인수하여 자신을 방어하는 현재의 시류를 비판한 것이라고 생각된다. 이러한 상황에서 한국의 토종 IT 기업인 시맨틱스(대표 조광현 www.semantics.co.kr)가 웹의 진화된 기술인 시맨틱 검색엔진큐로보(Qrobo)’를 개발, 세계 처음으로 완전 상용화에 성공하였다는 것은 대단히 의미가 큰 일이다.

시맨틱스는 조광현 대표가 1998년 검색엔진을 연구하는 회사로 설립하였고 2006년에 주식회사로 전환하여 현재 철통 같은 보안이 유지된다는 분당 금융결제원 건물 11층에 연구소를 두고 시맨틱 검색엔진을 개발하고 있는 회사이다.

 조광현 대표는 시맨틱스의 큐로보(Qrobo)가 개별 단어나 문자가 포함된 정보를 보여주는 기존 키워드 매칭 방식 검색엔진의 단순한 검색결과 한계를 극복하여, 인공지능형 소프트웨어 에이전트인 검색 로봇이 자동으로 검색 문장의 의미를 파악하고 추론해 신속하고 정확한 검색이 가능하다고 설명했다. 또한 기존 키워드형 검색엔진이 보여주는 방대한 양의 검색결과에 대한 한계를 극복할 수 있는 최신 기술이라면서기존 검색엔진에 비해 속도도 빠르다고 강조했다.

시맨틱스가 보유하고 있는 기술은 크게 두 가지로 요약해서 말할 수 있는데, 그 첫번째는 온톨로지 빌더(Ontology builder) 큐로보(Qrobo)라고 불리는 웹데이터로부터 온톨로지를 자동으로 구축하는 기술이다. 기존에 온톨로지 구축이라고 하면 주로 대학연구소나 국가기관연구소에서 언어학자와 박사들 여럿이 함께 모여서 일일이 수작업으로 구축하는 것을 생각할 수 있는데, 이 회사에서는 500대가 넘는 서버를 동원하여 컴퓨터가 24시간 풀가동되면서 쉴 새 없이 분석하면서 온톨로지 데이터를 자동으로 구축하는데, 관리하는 직원이 단지 몇 명이라고 한다.

시맨틱스가 보유하고 있는 두번째 핵심 기술은 시맨티사이징(Semanticizing) 시스템이라고 하는데, 시맨티사이징이라는 단어는 시맨틱스 연구소가 기술을 개발한 후 시스템에 붙일 적당한 명칭을 고민하다가시맨틱(Semantic)”이라는 단어에 “-화하다라는 의미를 가진 “-ize”를 붙여서 만든 신조어라고 한다. 그 의미는 말 그대로시맨틱화기술이라고 할 수 있겠다. 이것은 시맨틱 웹으로 작성되지 않은 기존의 웹사이트들로부터 웹데이터를 수집하면서 각 데이터 간의 의미관계를 정밀하게 분석하여 마치 시맨틱 웹으로 작성된 것과 같은 검색 효과를 내는 기술이다.

이 두 가지 핵심기술을 응용하여 만들어진 도큐로보(DOCUrobo)는 웹문서를 순간적으로 읽어서 문서의 성향이 1200여 개 카테고리 중 어디에 속하는 지 자동으로 분석해내는 기술이다. 예를 들어 최근 인기를 끌고 있는 드라마 태왕사신기에 관한 기사를 입력하면 문화>연예 카테고리에 34%와 학술>역사 카테고리에 52%, 국제정치>중국에 10% 정도씩 관련이 있는 것으로 분석이 되고, “동북공정에 관한 기사를 입력하면 학술>역사 카테고리에 62%와 국제정치>중국 카테고리에 37% 정도 관련이 있는 것으로 분석이 되는 식이다. 이 기술을 기존의 몇몇 시맨틱 웹 연구 기업들에서 데모 버전으로 선보인 적은 있지만, 도큐로보와 같이 완성된 형태로 발표된 것은 이번이 처음이다. 이 기술을 검색에 적용하게 되면 기존에 여러 차례에 걸쳐 검색해야 겨우 찾아낼 수 있는 정보들을 단번에 찾아낼 수 있다는 장점이 있다.

또한 기존 블로그들에서 형식적인 자동 태깅을 지원하고 있기는 하지만 그 수준이 매우 초보적인 수준임이 반해 시맨틱스에서 개발한 시맨틱 자동 태깅(tagging) 기술인 태그로보(TAGrobo)를 활용하면 주어진 블로그나 웹문서의 모든 단어에 관련된 의미군을 자동으로 추출하여 태그를 달아주기 때문에 블로거들이 그동안 일일이 태그를 달아주기 위해 불편했던 점을 말끔히 해소할 수 있을 전망이다. 영국 프리미어리그 맨체스터 유나이티드에서 활약하고 있는 박지성 선수에 대해 한 축구 전문 블로거가 좋은 기사를 썼을 때 검색포털사이트들의 스포츠>축구 카테고리에 이 기사가 노출되지 않고, “축구라는 검색어로도 검색되지 않은 경우가 있었는데, 그것은 그 글 속에 축구라는 단어가 한번도 나오지 않고, 또 글을 쓴 블로거가 태그를 달 때 축구라는 태그를 달지 않았기 때문이었다. 웹 상에서 실제 이와 비근한 예들은 얼마든지 찾아 볼 수 있다. 그것은 기존의 검색방식이나 태그를 다는 방식이 얼마나 원시적인지를 보여주는 좋은 예이다. 또한 검색 엔진에 태그로보를 활용하면 검색결과와 관련된 태그를 자동으로 보여주기 때문에 혹시 자신이 찾지 못했거나 생각이 나지 않아서 검색하지 못한 검색어들까지 쉽게 검색해 볼 수 있을 뿐 아니라 검색 광고를 하는 기업의 측면에서도 검색어와 관련성이 높은 태그들을 자동으로 추천해 줌으로써 검색 광고 효율을 비약적으로 증가시킨다는 장점이 있다. 그 외에도 검색시에 알맞은 검색어가 떠오르지 않아서 망설이게 될 경우에는 관련 검색어를 추천해주거나 디렉토리로 찾을 수 있는 방법을 제공하는 등, 앞으로 한국의 IT 시장에 강력한 새바람이 불 것으로 예상된다.

 

TRACKBACK 2 AND COMMENT 0

ARTICLE CATEGORY

분류 전체보기 (11)
시맨틱 검색엔진 (3)
포딕스 멀티미.. (2)
SEMANTICS Engl.. (5)

RECENT COMMENT

CALENDAR

«   2009/07   »
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

ARCHIVE