빅데이터와 관련해서는 확실히 관심들이 있으신 것 같습니다. 기술적으로 어렵고 이와 관련해서 업무를 하는 분들이 분명 제한되어 있는 국내에서 게다가 거의 포스팅을 하지 않는 제 블로그에도 꾸준히 빅데이터로 검색해서 들어오시는 분이 매일 100명 남짓 있는 것을 보면 빅데이터에 대한 관심이 얼마나 큰 지 알 수 있게 되었습니다.
아래 그림은 전통적인 BI,DW 기존 솔루션업체들이 협력하고 있는 하둡 솔루션 업체와의 관계를 간단히 정리해 본 것입니다. 보통 하둡시장에서는 대표적으로 Cloudera 와 Hortonworks 두 업체를 들지만 최근 엔터프라이즈 시장의 니즈에 맞게 하둡을 개선한 MapR 역시 주목을 받고 있습니다.
하둡의 코어에 대한 기술력과 차세대 아키텍쳐 개선등은 야후!에서 분사한 Hortonwork 가 주도하고 있다지만 하둡을 기반으로 하는 빅데이터 시장에 대한 리드는 기업시장과 클라우드 시장에 대한 기술지원과 교육 및 최적의 배포판을 만들어 제공하고 있는 Cloudera 가 하고 있다고보면 됩니다.
Hortonworks 조만간 자신들의 배포판을 만들 것으로 생각되고 IBM 역시 Apache Hadoop 을 기반으로 자신들의 Basic 과 Enterprise 배포판을 갖추고 있습니다. EMC 의 Greenplum 의 경우에는 기업시장을 위해서 MapR 의 배포판을 자신들의 DW 솔루션과 통합해서 제공하고 있으며 Apache Hadoop 을 기반으로 Community Endition 을 제공하기도 합니다.
한동안 오라클이 Hortonworks 와 협력을 하는가 싶더니 결국 Cloudera 를 선택, 자사의 하드웨어와 결합한 하둡 어플라이언스 제품을 최근 발표했습니다.
이밖에 Apache Hadoop 을 기반으로 빅데이터 시장에 뛰어든 회사 몇군데를 소개하니 참고하세요.
- DataStax : Hadoop + Hive + Cassandra http://www.datastax.com/
- Datameer : Analytic Solution : http://datameer.com
- Hadapt : Analytics Platform : http://www.hadapt.com/
- HStreaming : Real-time processing : http://hstreaming.com/
아마도 이 포스팅이 빅데이터와 관련해서는 마지막이 되지 않을까 싶네요. 하둡에 대한 기술적인 디테일을 제가 다 언급할만한 실력도 안되거니와 최근 관련한 책들도 많이들 나오고 있고 MapReduce 을 이용한 마이닝 알고리즘을 소개하는 책들도 더불어 소개되고 있으니 구글링이나 책을 직접 보시면 더욱 이해가 되시리라 생각됩니다.
요새 보는게 BIG DATA 밖에 없다보니, 자주 들어오게 되네요.
읽기만 하고, 감사글 남긴적없어서 오늘은 흔적 남기고 갑니다.
꾸벅.
네 저도 감사합니다.
출장 다녀와보니 또 멋진 포스팅. ㅠ_ㅠ
잘 다녀왔습니다. ^___^
파트너 서밋을 통해 데이터 분석을 얼마나 멋드러지게 기업현장에 적용할 수 있게될지에 대한 나름의 성찰과 확실한 자신감 그리고 제가 설계하는 분산처리 방식이 틀리지 않았음을 확인할 수 있는 시간이었습니다.
아 정말이지 IT일을 하는한 이 상큼한 경험들은 나이가 들어도 할 수 있다는 사실이 즐겁습니다.
꽃중년의 나이에도 행복한 나날입니다. ㅋ~
꽃중년이라 … 공감이 갑니다.
IT일을 하시면서 즐겁다고 말씀하시는 분이 아직도 계시다니 저도 듣기 좋습니다.
도안구 기잡니다. 위 이미지 출처를 밝히고 사용해도 되나요?
네 괜찮습니다. ^^