재조합 가능한 데이터 소스와 데이터 변형(Remixable data source and data transformations)
세상에는 창의적인 아이디어와 능력을 가지고 있는 사람들이 많다. 이들에게 데이터만 주어진다면 재미있고 유용한 서비스를 스스로 만들 수 있을 것이다. 그런데 데이터는 오랜 시간과 막대한 비용을 들여야만 확보될 수 있기 때문에 데이터의 주인은 아무나 될 수 없다.
정보 서비스를 제공하기 위해 데이터를 확보하려면 시간적/비용적 투자가 뒤따라야 하는데, 이러한 투자가 여의치 않자 기업의 데이터를 가로채는 사건이 일어났다. 부동산 정보 제공업자가 구글의 지도 정보(maps.google.com)를 해킹하여 자신의 부동산 정보 서비스인 ‘하우징맵스닷컴( www.housingmaps.com)’에 가져다 쓴 것이다.
하우징맵스닷컴은 ‘크래이그리스트( www.craigslist.com)’의 부동산 정보 목록을 보다 효과적으로 보여주기 위해 구글의 지도 정보를 이용하였다. 이처럼 데이터, 어플리케이션, 서비스의 조합하여 새로운 데이터, 어플리케이션, 서비스를 창출하는 기법을 매시업(mash-up)이라고 부른다.

www.housingmaps.com

하우징맵스닷컴의 매시업 구조1
이 사건은 구글로 하여금 데이터의 재사용에 대한 통찰력을 갖게 만들었다. 구글은 인터넷으로 연결된 모든 웹사이트가 그들의 사업 영역이었기 때문에 구글의 데이터가 구글 밖에서 유통/소비되는 것을 흔쾌히 받아들인 것으로 보이며, 오히려 새로운 비즈니스 기회를 얻을 수 있다는 판단을 한 것 같다.
데이터 가공을 위한 정보기술이 많이 발전했기 때문에, 일반 사용자와 개발자에게 데이터 이용 권한을 웹 서비스(Web service)로 제공한다면, 웹 콘텐츠는 지금보다 훨씬 더 다양해지고 풍부해질 수 있다.
구글의 데이터가 제공되면 구글의 웹 콘텐츠가 더 다양해지고 풍부해지며, 네이버의 데이터가 제공되면 네이버의 웹 콘텐츠가 더 다양해지고 풍부해지는 것이다.
온라인 비즈니스의 핵심은 데이터이다. 가령, 검색 비즈니스는 검색 목록 데이터, 음악 비즈니스는 음악 데이터, 전자상거래 비즈니스는 상품 목록 데이터가 있어야만 비즈니스를 수행할 수 있다.
전략, 기획, 설계, 개발과 같은 역량은 모두 데이터를 비즈니스에 이용하기 위한 활동에 지나지 않는다. 물론 이러한 활동도 중요하지만, 그 중요도가 데이터를 넘을 수는 없다.
만약 구글의 의도대로 구글의 데이터가 보다 많은 비즈니스에 이용된다면 구글은 구글의 데이터를 이용한 비즈니스와 긴밀한 관계를 유지하게 될 것이고, 이런 관계가 증가할수록 웹 환경은 구글의 영향력은 커지게 될 것이다.
이러한 전략은 구글 뿐만 아니라 다른 닷컴 기업도 시도하고 있다. 아마존, 플리커 등은 API를 통해 자신의 데이터가 외부에서 유통/소비될 수 있는 환경을 제공하고 있다.
아마존은 상품 데이터를 대부분 개방하고 있는데, 이 데이터를 가지고 많은 기업들이 창의적인 비즈니스를 영위하고 있다. 아마존 입장에서는 외부 기업들이 구축해 놓은 서비스로부터 고객을 획득할 수 있는 기회가 생긴 셈이다. 즉, 더 많은 사람들이 활동하는 ‘외부’에서 아마존이 영업을 하고 있는 것이다.
앞으로의 웹사이트는 사람뿐만 아니라 기계(웹사이트)를 위해 서비스해야 한다(Web Site as Web Services). 아래 그림처럼 내부 데이터가 매시업 도구를 통해 외부 웹사이트에서도 소비되는 웹 서비스 구조를 고려한다면, 웹사이트의 목표고객은 사람뿐만 아니라 웹사이트도 포함되어야 한다.

(출처)
http://www.readwriteweb.com/archives/web_30_when_web_sites_become_web_services.php
아마존, 플리커와 같은 몇몇 시장 지배적인 기업을 제외하면, 데이터 개방은 부담스러울 뿐만 아니라 준비 작업도 만만치 않다. 이런 경우, ‘댑퍼(www.dapper.net)’, ‘야후! 파이프(pipes.yahoo.com)’와 같은 매시업 도구를 통해 정보를 개방하는 것도 좋은 방법이다.
‘댑퍼’는 웹 브라우저가 렌더링한 부분(눈으로 확인할 수 있는 부분)을 캡처하는 방식의 매시업 도구이며, ‘야후! 파이프’는 API와 RSS 피드를 재조합하는 방식의 매시업 도구이다.
이런 매시업 도구가 좀더 널리 사용된다면, 마케팅 기회를 얻지 못하여 이용도가 지지부진한 데이터가 다른 서비스와 매시업되어 좋은 결과를 거둘 수도 있을 것이다.
“데이터가 곧 서비스”라면 데이터의 재조합(remix)과 변형(transformation)은 굳이 필요 없을 것이다. 좋은 데이터를 가지고 있더라도 좋은 서비스를 제공하지 못하는 경우가 많다. 이것이 데이터의 재조합과 변형이 필요한 이유이다.
웹 1.0 시대의 기본 정보 단위는 ‘페이지(page)’이다. 정보 제공자는 읽을 거리를 미리 만들어 둔 다음, 페이지 형태로 웹 서버에 담아두었다. 웹 브라우저와 서버 간의 데이터 교환이 페이지 단위로 이루어졌기 때문에 정보를 분류하고 구성하는 작업도 페이지 단위로 이루어졌다. 그리고 다른 시스템(웹사이트) 간의 연결은 주로 링크나 웹 페이지 단위로 이루어졌다.
그런데 시스템이 구조화되면 구성 요소를 쉽게 분리할 수 있다. 적어도 데이터와 컨트롤 요소는 서로 분리되어야 하는데, 많은 웹사이트들이 구조화에 대한 노력이 부족했다. 그러다 보니 웹사이트 간의 연결이 링크 또는 웹 페이지 수준에 머물 수 밖에 없었던 것이다. 즉, 데이터가 UI에 종속된 것이다.
이것보다 발전된 개념이 데이터 소스에 의한 연결이다. 데이터가 UI로부터 자유롭게 되면, 이동과 구현도 자유롭게 된다. 하나의 데이터를 인트라넷, 어플리케이션, 자체 웹사이트, 외부 웹사이트, 모바일, IPTV 등 다양한 서비스 채널에 활용할 수 있게 되므로 데이터의 유용성이 훨씬 더 커지게 된다.
과거에는 ‘Closed data’가 경쟁우위를 가질 수 있었지만, 네트워크로 연결된 웹에서는 ‘Open data’가 더 나은 가치를 가질 수 있다. ‘Open data’를 제공한다면 웹사이트는 단순히 서비스 개념을 넘어 데이터 플랫폼으로써 역할을 수행할 수 있게 된다.
데이터 소스에 대한 개방도 중요하지만 보다 쉽게 서비스를 만들 수 있도록 API를 공개하는 것도 중요하다. 이런 일들은 구글이 잘 하고 있다는 생각이 드는데, 단순히 기업 규모가 크기 때문에 할 수 있었던 것은 아니라고 본다. 이보다는 필요성을 인식했고, 이를 실천할 의지가 있었기 때문에 가능하지 않았을까?
-------------------------------
1 http://bokardo.com/podcasts/Web20-Joshua-Porter.pdf
|