Category Archives: 공지사항

MSFT >> SNAP

The biggest risk is not taking any risk… In a world that changing really quickly, the only strategy that is guaranteed to fail is not taking risks. — Mark Zuckerberg

snapchat_sci2

필자가 MS의 데이터 과학자로서 검색 모델을 만들고 평가하는 일을 시작한지 약 5년이 지났다. 그동안 다양한 팀과 일하면서 여러 검색 및 평가 지표를 개발하였고, 그 과정에서 검색을 포함한 다양한 온라인 서비스의 품질을 평가하는 일에 대한 전문성을 쌓을 수 있었다. 연구자에게 MS는 특히 거의 이상적인 직장이다. 엄청난 데이터와 컴퓨팅 자원, 여전히 세계 최고 수준을 자랑하는 연구자들, 출퇴근 시간에 아무도 신경쓰지 않는 자유로운 근무 환경까지 말이다. 아마 평생 MS에서 좋은 경력을 쌓는다고 해도 괜챃은 삶이 될 것이다.

하지만 지난 4년간 MS에 근무하면서 세상이 얼마나 빠르게 바뀌는지를 실감했다. 전통적인 웹 검색이 모바일 검색에 추월당한 것이 몇 년 되지도 않았는데, 모바일 검색도 음성 비서 등에 조만간 자리를 내줄 전망이다. 대부분의 기계학습 연구자들이 앙상블(ensemble) 러닝에 열광하던 것이 엇그제 같은데, 어느새 대학생들도 딥러닝을 공부하는 시대가 되었다. 데이터 과학계의 뉴스가 공유되는 Datatau에는 거의 매일 새로운 시각화, 기계학습, 데이터 처리 도구가 올라온다.

데이터 과학 분야에서 약 10년간 배우고 일했으며, 새로운 지식과 기술을 배우는 것을 누구보다도 즐긴다고 자부하는 필자에게도 이는 현기증이 날만한 속도다. 그 동안 공부를 멈추지 않기 위해 매년 꾸준히 논문을 쓰고, 작년에는 책까지 출간했지만 이런 변화를 따라가기에는 충분치 않다고 느꼈다. 변화에 적응하고, 나아가서 이를 선도하기 위해서는 좀더 작고 기민한 조직에서 일해야겠다는 생각을 했다. 조직에 속한 개인의 발전 속도는 그 조직의 민첩성에 제한받기 마련이기 때문이다.

이와 함께 필자에게 찾아온 것이 전통적인 ‘연구’에 대한 회의다. 필자는 검색 모델 및 평가 분야에서 박사 학위를 받고 MS에 와서도 꾸준히 논문을 써 왔다. 이공계의 박사 과정은 자신이 택한 분야의 최신 지식과 기술(state-of-the-art)을 습득하고 나아가 이를 한단계 끌어올리는 것을 목표로 하며, 필자는 여기에 도전한 것을 한번도 후회한 적이 없다. 하지만, 학위를 받고 약 5년간 같은 분야의 일을 하면서 과연 필자가 선택한 연구자로서의 진로가 스스로의 미래에 최선의 길인지에 대해 최근에 의구심이 들기 시작했다.

오해의 소지를 막기위해 밝히자면 필자는 여전히 연구를 좋아한다. 필자가 의구심을 갖는 것은 ‘학술적인(academic)’ 연구자의 길을 가는 것이다. 주요 저널이나 컨퍼런스에 게시하기 위한 논문을 쓰는 것이 실제 세계에 영향을 미칠 수있는 최선의 방법일까 하는 고민이다. 연구 논문을 쓰는 일은 엄격한 형식을 요구하며, 그 결과가 컨퍼런스 등에 발표되어 세상의 빛을 보는 데에는 오랜 시간이 걸린다. 실제 세계의 큰 영향을 주는 훌륭한 연구자와 논문이 있지만 이는 매우 드물며, 이는 환경과 노력 그리고 운이 모두 결합되야 가능한 일이다.

논문이 아니라도 최근에는 블로그, GitHub 페이지, SNS 등 자신의 연구 결과를 전달하고 검증받을 수 있는 방법이 얼마든지 있다. 컨퍼런스 역시 학술 컨퍼런스 이외에 OSCon이나 Strata와 같은 산업계 컨퍼런스도 활발하다. 과거에는 제대로 된 연구를 하려면 학계에 있어야 했지만 점차 그런 벽도 허물어지고 있는 것이다. 예전에는 언론사의 기자가 되어야 뉴스를 전할 수 있었지만, 지금은 누구나 글을 써서 널리 퍼뜨릴 수 있는 것과 같은 이치다. 기술 발전에 따라 이런 소위 ‘연구의 민주화’라는 추세는 점차 가속화될 것이다.

MS에 처음 들어올 때만 해도 필자는 계속 논문을 쓸 수 있고 학계에서 활동할 수 있는가를 직업 선택에서 가장 중요한 기준으로 삼았다. 하지만 이제 그런 전통적인 연구자의 길을 고집하지 않기로 했다. 이보다는 어떤 형태가 되었던 새로운 기술과 지식을 접하고 발전시키며, 이를 통해 중요한 문제를 해결하고 세상에 임팩트를 만들 수 있는 일을 하고 싶다는 생각이다. 제도와 형식의 구속을 벗어 던질수록 연구자로서의 본질에 충실할 수 있지 않을까.

이런 고민 끝에 필자는 최근 스냅(Snap Inc.)에서의 새로운 도전을 결심했다. 스냅은 미국 및 유럽의 젋은 층에게 인기를 끌고 있는 SNS 서비스인 스냅챗(Snapchat)으로 잘 알려진 회사로, 최근에는 사진 및 동영상을 손쉽게 촬영할 수 있는 스팩타클(Spectacle)을 선보이기도 했다. 올해 창업 42년이 지난 MS가 중년의 회사라면 스냅은 이제 사춘기를 지나 어른이 되려고 하는 어린 회사다. 또한 스냅챗은 사진 및 비디오 중심의 SNS 서비스니, 필자가 주로 해오던 웹 문서 중심의 검색과는 상당히 다른 영역이다.

스냅은 독특한 제품과 기업 문화로도 잘 알려져 있다. 스냅챗은 카메라가 초기 화면에 나오는 인터페이스, 받자마자 지워지는 메시지, 이벤트에 관련된 사진과 비디오를 시간순으로 묶어서 보여주는 스토리 등 개성있는 디가인과 기능으로 미국과 유럽 10-20대를 중심으로 한 두터운 이용층을 확보하고 있다. 작년에는 카메라가 달린 선글라스인 스펙타클을 런치하고, 이를 옮겨다니는 자판기를 통해 판매하는 독특한 마케팅으로 화제가 되기도 하였다. 대부분의 테크 회사가 실리콘벨리를 거점으로 하고 있지만, 스냅은 LA의 베니스(Venice) 해변가에 오피스가 있다는 점도 다르다.

새로운 회사에서 만만치 않은 도전이 예상되지만 이는 역으로 보면 성장의 기회이기도 하다. MS에 있을때보다 업무야 더 바빠지겠지만 한창 성장하는 젊은 스타트업의 활기찬 에너지를 느끼고, 이에 기여하는 것도 나쁘지는 않은 경험이다. 웹이 아닌 채팅 로그, 그리고 소셜 네트워크 데이터를 만져보는 것도 데이터 과학자로서의 한번 해보고 싶었던 일이다. 문서가 아닌 사진이나 비디오를 검색하거나 추천하는 모델을 만드는 것도 흥미있어 보인다. 정든 시애틀을 떠나는 것도 아쉽지만 LA에서의 생활도 기대가 된다.

서두에서 인용한 마크 저커버그의 말처럼 변화하는 세상에서 가만히 있는 것만큼 위험한 일도 없을 것이다. 이제 변화의 파도에 올라 탔으니 물결에 몸을 맡기고 어디든 가야 할 것이다. 그 목적지가 어딘지는 아직 모르지만, 결말이 뻔한 영화처럼 시시한 것도 또 없지 않은가.

p.s. Snapchat은 여기서 다운받아 사용하실 수 있습니다.

제 Snapchat ID는 lifidea이니, 친구 등록해주세요 :)

헬로 데이터 과학을 공개합니다!

‘헬로 데이터 과학’이 드디어 세상의 빛을 보게 되었습니다. 지금 YES24에서 구매를 하실 수 있습니다. 아래는 책 집필에 대한 저의 소회를 담았습니다.


빅데이터니 데이터 과학이니 데이터에 대한 출판물이 쏟아지는 요즘, 또 책을 쓰겠다는 결심이 쉬운 것은 아니었다. 소위 ‘데이터 열풍’이 시작되기 훨신 전부터 스스로 다양한 데이터를 모아 분석하면서 느꼈던 데이터의 가치에 대한 믿음이 가장 큰 원동력이 아니었다 싶다. 굳이 빅데이터가 아니라도, 그리고 복잡한 수학이나 프로그래밍 없이도 데이터에서 많은 가치를 얻을 수 있다는 메시지를 담는다면 의미있는 목소리가 되겠다는 생각을 했다.

하지만 세상의 많은 일이 그렇듯이 책을 쓴다는 일이 어떤 일인지 알았다면 아예 시작조차 하지 않았을 것이다. 처음에 오랫동안 쓰던 블로그의 연장선 정도로 생각했던 책쓰기가 마치 오두막과 마천루를 짓는것과 같은 차이가 있다는 사실을 깨닫기까지는 그리 오랜 시간이 걸리지 않았다. 글을 쓴다는 공통점은 있지만 작업의 규모, 깊이, 그리고 프로세스 면에서 전혀 다른 차원의 결심과 노력을 요구하니 말이다. 물론 이미 시작한 뒤에는 쉽게 멈추기 힘든 매력을 발견하기도 하였다.

그럼에도 불구하고 집필을 시작한 것을 후회한 시간보다는 감사하게 생각했던 시간이 많았던 것 같다. 대학원을 마치고 시작한 회사 생활이 3년차에 접어들면서 현상에 안주하기 시작한 나 자신의 지적인 성장을 꾸준히 채찍질하는 계기가 되었고, 특히 데이터 과학이라는 새롭지만 방대한 분야의 다양한 이론과 사례를 내것으로 소화하는 기회를 얻을 수 있었다. 또한 집필을 시작하고, 집필한 내용을 틈틈이 블로그 및 각종 매체에 기고하기 시작하면서 다양한 인연을 만들 수 있었다.

착수부터 마무리까지 약 1년 반이 걸린 집필 기간동안 필자는 다음 세가지 원칙을 지키기 위해 애썼다. 그리고 책을 마무리한 지금 이순간, 이 원칙들이 어느 정도는 지켜졌다는 생각에 흡족한 마음이다.

최신의 지식과 자신의 노하우를 결합한다. 매일 새로운 기술이 쏟아지는 데이터 과학의 가급적 최신 트렌드를 전하되, 필자 자신의 목소리를 담으려고 애썼다.

매일 읽고 쓰되, 억지로는 하지 않는다. 재미있게 쓴 글이 읽기도 재미있을 것이다. 필자의 생산성 관리 원칙을 적용해 매일 조금씩 하되 무리해서 쓰려고 하지는 않았다.

집필 과정에 데이터 과학을 최대한 활용한다. 가장 좋은 교육은 본보기를 보여주는 것이다. 한 권의 책을 만드는 과정에 필요한 다양한 의사결정에 최대한 데이터를 활용하였다.

좋은 책을 만들겠다는 결심에서 세운 이 원칙들이, 사실 필자가 책 집필이라는 프로젝트를 완수하는데 결정적인 도움을 주지 않았나 생각도 해본다. 필자 자신의 목소리를 담으려고 하지 않았다면 무의미함에 포기했을 것이고, 매일 조금씩 하지 않았다면 지쳐서 포기했을 것이며, 독자 분들의 의견을 청취하고 수렴하는 과정이 없었다면 길을 찾지 못하고 포기했을테니 말이다. 책 집필 과정에 대한 자세한 이야기는 조만간 공개할 예정이다.

어쨌든 우여곡절 끝에 ‘헬로 데이터 과학’을 독자 여러분 손에 내놓게 되었다. 지금 당장 원하는 독자는 아래 링크를 통해 YES24에서 책을 주문할 수 있다. 그동안 참 많은 분들께서 ‘책 언제 나와요’ 라고 물어보실 때마다 쥐구멍에라도 들어가고 싶었는데, 이제 자신있게 답할 수 있게 되었다. ‘최선을 다해 열심히 만들었으니 잘 보셨으면 좋겠네요!’

YES24 바로가기: ‘헬로 데이터 과학 : 삶과 업무를 바꾸는 생활 데이터 활용법’
(책의 목차 및 추천사, 출판사에서 만들어 주신 위트있는 그래픽을 감상하시기 바란다!)

추신: 사람이 하는 일이 다 그렇지만 책은 정말 혼자서는 절대 만들 수 없다. 처음부터 끝까지 격려해준 가족들과 (특히 아내) 친구들, 그리고 유닌히도 고집이 센 저자를 이해하고 다독여 준 한빛미디어의 최현우 팀장님과 송경석 차장님, Last but not least 이 책의 재료가 된 블로그 글과 초고에 대해 응원과 조언을 아끼지 않은 독자 그룹 분들과 리뷰어 분, 그리고 그 중 추천의 글을 허락해 주신 고영혁/권정민/엄태욱/전희원/하용호 님, 그리고 오삼균 교수님께 특별한 감사의 말씀을 전한다.

빅데이터에 이어 생활데이터의 시대가 온다

(제 브런치와 ZDNet에 소개된 글입니다. 생활데이터 모임에 참가하실 분은 링크를 참조하세요.)

필자가 어디서 ‘데이터 과학자’라고 하면 보통 ‘아, 빅데이터 하시는군요’ 라고 하시는 분들이 많다. 하지만 필자가 누누히 밝혔듯이 데이터는 문제 해결의 수단이고, 빅데이터를 꼭 써야 문제가 풀리는 것은 아니다. 필자는 빅데이터보다 주변의 문제를 끊임없이 데이터로 푸는 ‘생활 데이터’가 필요하다고 믿는다.

생활 데이터 사례: 당뇨병 관리 & 치킨집 수요 예측

우선 생활 데이터를 사례로 알아보자. 한국 네스프레소(Nepresso)의 디지털 어퀴지션 매니저로  일하는 서영부님에게는 최근 고민거리가 생겼다. 장모님께서 당뇨병 진단을 받으신 것이다. 아버님께서 10년 넘게 당뇨 증상이 있으셨던 터라 당뇨병 환자에게 필수적인 혈당 관리의 번거로움을 누구보다도 잘 아는 그였다.

실제로 장모님께서는 새로운 식이요법에 적응하느라, 혈당 측정을 하시느라 여러 가지 어려움을 겪고 계셨다. 공복 시 혈당은 120 이하, 식후 혈당은 160 이하를 유지한다는 목표를 세우고 아침 공복 1번, 식후 3번 측정의 빈도로 측정을 시작하셨지만 이를 꾸준히 기록하는 것을  힘들어하셨다.


서영부 님께서 공유해주신 장모님의 혈당 기록표: 중간 중간 빠진 부분이 보인다

평소 업무상 데이터를 늘 활용하는 서영부님은 장모님께 혈당관리를 위한 데이터 사용법을 가르쳐드렸다. 종이에 입력하시던 혈당 데이터를 엑셀에 옮겨 추이를 보여드리고, 추가로 데이터를 넣으시면 그래프가 그려지도록 만들어드린 것이다. 또한 혈당 관리를 위해서는 어느 기준점 이하로 그래프가 내려가야 한다는 점을 이해시켜드렸다.


서영부 님께서 공유해주신 장모님의 혈당 기록표 엑셀 버전

이를 통해 장모님께서는 측정하는 숫자와 목표간의 관계를 이해하실 수 있었다. 이와 함께 서영부님은 장모님께서 혈당관리에 필수적인 운동량을 채우실 수 있도록 미 밴드도 드렸다. 단순히 밴드를 드린 게 아니라 운동량의 기준을 설정하여 운동량이 부족한 날은 더하시고, 많은 날은 쉬시도록 말씀을 드렸다. 이런 사위의 정성에 장모님이 감동하신 것은 물론이다.

이상은 작년 12월 필자가 주최한 ‘생활데이터’ 모임에서 서영부님께서 직접 발표하신 내용이다. 서영부님은 본인이 의사 거나 의학 데이터를 다루어 보신 것은 아니지만, 간단한 도구를 사용하여 주어진 데이터를 시각적으로 이해하고, 운동량을 정확히 측정하도록 장모님을 도와드린 것이다. 위 사례에서는 엑셀을 사용했지만 필자의 지난 글에서는 종이와 펜만으로 15년간 당뇨병을 이겨낸 사례를 소개하기도 했다.

간단한 데이터 활용으로 비즈니스에 큰 변화를 가져온 경우도 있다. 작년 통계청에서 주최한 통계활용 수기 공모에서 최우수상을 차지한 통계로 튀기는 치킨은 치킨집을 하는 아버지를 돕기 위해 매일 매일의 계육 수요를 예측하는 모델을 만들어 활용했던 대학생 허성일님의 이야기다. 제품의 품질과 비용 절감을 위해 필수적인 수요 예측의 문제를 계절, 날씨, 이벤트와 같은 단순한 속성을 바탕으로 예측해낸 것이다.


‘통계로 튀기는 치킨’에서 사용된 계육 수요 예측 모델

예측 모델이라지만 사실 위 테이블에서 보듯 몇 개의 변수에 가중치를 주어 결합하는 방정식이니 복잡한 통계 기법을 사용한 것은 아니다. 하지만 위 모델의 예상량과 실제량을 비교한 아래 그래프를 보면 상당한 정확도를 자랑함을 알 수 있다. 허성일 씨가 이 예측모델로 아버님의 사람을 듬뿍 받은 것은 물론이다.


‘통계로 튀기는 치킨’에서 사용된 계육 수요 예측 모델의 성능

생활 데이터를 실천하는 사람들: Quantified Self

위 사례의 주인공들에게는 자기 주변의 문제에서 출발하여, 비교적 간단한 데이터와 방법으로 문제에 접근하였다는 공통점이 있다. 데이터라면 흔히 대형 컴퓨터나 복잡한 수식을 떠올리지만 이들은 데이터를 두려워하는 대신 자신의 문제를 해결해주는 수단으로 적극 활용한 것이다. 필자는 이처럼 데이터를 자신의 문제를 푸는 수단으로 적극 활용하는 태도를 ‘데이터 생활화’ 혹은 ‘생활 데이터’라고 부르고 싶다.

이처럼 데이터를 적극적으로 활용하는 개인의 이야기가 약간 낯설게 느껴질지도 모르겠다. 하지만 정보기술의 발전에 따라 최근 들어 개인이 자신의 삶과 업무에서 데이터를 수집하여 활용하려는 움직임이 전 세계적으로 확산되고 있다. 그리고 이 트렌드의 중심에는 앞서 소개한 Quantified Self라는 (의미: 계량화된 자신, 이하 QS) 이름의 커뮤니티가 자리하고 있다.

QS는 말하자면 자기 주변의 문제를 직접 데이터로 해결하는 생활 데이터를 실천하는 개인들의 커뮤니티로 2007년 시작된 이래 현재 약 34개 국에 100개가 넘는 지역별 그룹을 가진 단체로 성장해왔으며, 2011년부터는 매년 미국과 유럽에서 국제적인 규모의 콘퍼런스가 개최되고 있다. 이는 생활 데이터의 활용에 대한 폭발적인 관심을 대변한다. 필자는 꾸준히 QS 모임에 참여하고 있으며, 필자의 개인 행복도 측정 관련 발표는 시애틀 타임즈에도 소개되기도 했다.

그럼 QS커뮤니티의 사람들은 어떤 유형의 데이터를 모으는 것일까? 이를 살펴보면 사람들이 주로 모으는 가장 흔한 데이터는 활동량, 음식, 몸무게, 수면 및 감정 데이터이다. 자신의 웰빙과 직접 관련된 데이터를 주로 모으는 것을 알 수 있다. 하지만 사람들은 이외에도 인지 기능, 혈당량, 위치, 심박수, 스트레스, 생산성 등 굉장히 다양한 종류의 데이터를 모으고 있다. 자세한 목록은 QS 웹사이트의 가이드를 참조하자.

생활 데이터의 종류와 빈도

하지만 이들은 대부분 데이터 과학자가 아닌 평범한 사람에 불과했다. 그렇다면 이들은 어떻게 이런 분석을 수행하고 있을까? 최근 연구에서는 QS 커뮤니티 회원들이 데이터 수집 및 분석에 주로 사용되는 도구의 분포를 소개하고 있다. 연구 결과를 보면 엑셀 등의 단순한 도구를 사용하는 사람들이 절반 가까운 44%를 차지하고 있다. 데이터로 자기 주변의 문제를 푸는데 대단한 도구가 필요하지는 않다는 결론을 내릴 수 있다.

데이터 과학 입문의 지름길: 생활 데이터

필자는 데이터 과학을 처음 공부하려는 사람들에게도 여러 이유에서 생활 데이터를 꼭 권한다. 우선 자신의 삶과 업무에 관련된 문제들을 푸는 것은 낯선 누군가의 문제를 푸는 것보다 흥미로운 일이다. 만약 데이터를 통해 나를 괴롭히는 지긋지긋한 건강 문제에서 벗어날 수 있다면? 혹은 지금 보다 업무의 생산성을 획기적으로 높일 수 있다면? 데이터 과학을 공부하기 위해서가 아니라도 충분히 동기부여가 된다.

또한 자기 자신의 문제를 푼다면 그 문제의 핵심은 무엇인지, 그리고 어떤 데이터를 모아야 할지에 대해서도 스스로 알 수 있다. 물론 도출한 해결책에 대한 평가도 스스로 내릴 수 있다. 즉, 스스로 문제 정의부터 해결책 도출에 이르기까지 데이터 과학의 전 과정을 진행해볼 수 있다. 이런 경험은 앞으로 여러 사람과 좀 더 복잡하고 규모가 큰 문제를 해결할 때 큰 도움이 된다.

마지막으로 생활 데이터는 그 특성상 크기도 작고, 관련된 문제들도 단순하다. 덩치 큰 도구나 어려운 분석 기법을 적용하지 않고도 결론에 도달할 수 있다. 이런 경험을 통해 데이터에서 가치를 끌어내는 과정이 꼭 복잡하고 어려울 필요가 없다는 점을 깨닫게 될 것이다. 이처럼 주변의 현상을 데이터 관점에서 바라보는 훈련을 통해서 데이터 문제를 발견하는 시각을 기를 수 있다.

이처럼 자신의 주변에서 흥미로운 문제를 발견하고, 이를 해결해나가는 과정을 통해 데이터 과학을 공부하다 보면 어느새 데이터 과학자의 태도와 소양을 갖춘 자신을 발견하게 될 것이다. 필자가 2002년 데이터 과학이라고 부를만한 활동을 시작하게 된 것도 주변의 다양한 데이터를 모아서 분석하면서부터다.

집밥을 사랑하는 당신, 생활 데이터를 시작하라!

최근 들어 백종원 씨 등의 영향으로 집밥 열풍이 불고 있다. 집밥의 장점은 원하는 음식을 자기가 구입한 재료로 자신의 입맛에 맞게 조리해 먹을 수 있다는 점이다. 스스로의 힘으로 해 먹으니 외식보다 저렴하고 안전하게 한 끼를 해결할 수 있는 것이다. 또한 외식과 달리 집밥을 습관화하면 요리 실력이 늘어 더 적은 노력으로 더 맛있는 음식을 해먹을 수 있을 것이다.

집밥을 차려 먹듯 자기 주변의 문제를 데이터로 풀어보는 ‘생활 데이터’

필자는 생활 데이터를 집밥에 비유하고 싶다. 우리는 보통 다른 사람이 모으고 분석한 결과를 사용하거나, 데이터 업무를 전문가에게 맡겨야 된다고 생각한다. 하지만, 글의 서두에서 소개한 사례에서 볼 수 있듯이 데이터로 주변의 문제를 해결하는 일이 꼭 거창하고 복잡할 필요는 없다. 그리고 앞서 소개한 Quantified Self 커뮤니티와 같이 실제로 스스로 하는 데이터 수집과 분석이 글로벌 트렌드로 자리 잡고 있다.

집밥과 마찬가지로 생활 데이터의 장점은 지금 나에게 필요한 문제를 나에게 맞는 방식으로 해결할 수 있다는 점이다. 내가 수집한 데이터에서 직접 내린 결론이므로 어딘가에서 읽은 지식보다 나에게 훨씬 적합한 결론에 도달할 수 있다. 또한 다른 사람에게 맡길 필요가 없으므로 시간과 비용이 절약되는 것은 물론이다. 특히 21세기의 석유라고 불리는 데이터를 자신의 핵심 경쟁력으로 삼고 싶은 사람이라면 생활 데이터를 당장 시작해야 할 것이다.

생활 데이터를 시작하는 사람들: ‘생활데이터’ 그룹

그럼 어디서 생활 데이터를 시작할 수 있을까? 우선 데이터 과학에 대한 필자의 다양한 글을 참고하고, 필자가 작년 말 시작한 페이스북 생활데이터 그룹에서 생활 데이터를 시작하는데 필요한 다양한 조언을 얻을 수 있다. 생활데이터 회원으로 활동하기 위해서는 페북 그룹에 가입 신청을 하고 간단한 가입 양식을 작성하면 된다.

생활데이터 그룹의 첫 모임이었던 작년 12월 모임에는 서두에 소개한 서영부님을 비롯한 스무 분이 참석하셨다. 이중 현재 카이스트에 대학원에 재학중이신 박건우님은 피트니스 앱 사용을 지속하는 사용자들의 특징을 소셜 미디어 데이터로 분석하셨고, 모임에 참석은 못하셨지만 김영웅님은 지하철 데이터를 분석해서 연말에 붐비지 않고 데이트를 할 수 있는 장소를 시각화한 결과를 공유하셨다.

올해도 생활데이터 모임에서는 온라인 정모를 통해 자기 주변의 데이터 활용 사례와 방법을 꾸준히 공유할 생각이다. 필자와 함께 국내 여러 유명 데이터 과학자들과 생활 데이터 애호가들이 활발히 활동하고 있다. 데이터 과학을 실습과 경험을 통해 배우고자 하는 분, 데이터로 꼭 풀어보고자 하는 문제가 있는 독자 여러분의 많은 참여를 바란다. 이어지는 글에서는 생활 데이터를 시작하는 방법을 자세히 다루도록 하겠다.

헬로! 데이터 과학

제 개인 홈페이지를 헬로 데이터 과학으로 개편했습니다. ‘헬로 데이터 과학’이라는 이름에는 데이터 과학을 시작하는 여러분들께 좀더 가까히 다가가겠다는 바램을 담았습니다. 아래 같은 이름의 페이스북 페이지도 만들었습니다. 앞으로 페이스북 페이지에는 데이터과학 관련 각종 소식이나 자료를 공유할 생각입니다. 아래 주소에서 ‘LIKE’ 하시면 편리하게 업데이트를 받아보실 수 있습니다.

페이스북 페이지: https://www.facebook.com/hellodatascience