비즈니스를 위한 데이터 과학
(포스터 프로보스트, 톰 포셋 지음 | 강권학 역)
빅데이터?? 사물인터넷?? 과연...
요즘 IoT 사물인터넷으로부터 많은 양의 데이터들이 주는 많은 정보력과 분석의 필요성에 대해 많은 이야기가 대두되고 있다. 특히 이런 데이터들의 양은 빅데이터라 불릴만큼 많아질 것이며, 그만큼 빅데이터를 분석하고 분석할 환경을 만들 인재에 대해서 정부와 학계에서 발벗고 나서서 많은 지원 사업을 벌이고 있다. 과연 많은 양의 데이터로부터 정말 의미있는 정보를 얻을 수 있을까??.. 누구나 빅데이터 분석에 대한 이야기를 처음 접한 사람이라면 한번쯤은 생각해볼 의문일 것이다. 빅데이터... 필자의 생각에는 충분히 이 빅데이터로부터 의미있는 정보를 얻을수 있다. 단, 그만큼의 분석력과 분석 계획 및 목표가 명확하다면 말이다.. |
비즈니스를 위한 데이터 과학
필자가 맨 처음 이 책을 펼쳐 목차를 보고 사실 좀 아쉬운 감이 있었다. 바로 챕터간 연관성 이 부족하다고 생각했기 때문이다. 사실 공부를 하는 학생의 입장에서 보면 각 챕터의 연관성은 곧 공부의 흐름이기 때문에 중요하다고 생각한다. 이 목차가 각각의 연관성을 가지고 잘 배치가 되어있다면 학생의 이해도는 높아져 정보의 흡수력이 높아질 것이다. 하지만 반대로 목차의 배치가 연관성이 부족하게 배치가 되어있다면 이대로 공부했던 학생의 이해도는 떨어져 여러번 책을 읽어봐야 할꺼 같다는 생각이 든다. 물론 책이 전체적으로 이상하다 그런게 아니라 각 목차들이 연관성이 조금 떨어지게 배치되었다는 것이다. 즉, 이 책은 초보자들에게는 약간 어려울 수 있다고 생각한다. 물론 내용은 아주아주 명쾌하고 하나하나 단어들의 설명이 자세해서 좋다. 아래는 이 책의 목차이다. |
1장. 개요 : 데이터 분석적 사고 방식 2장. 비즈니스 문제와 데이터 과학 해결책
부록 A.3 용어 정리 |
내용면으로 봐서는 너무나 이책은 자세하다. 용어 하나하나에 대한 정의와 설명이 세세하게 잘 되어있다. 마치 용어사전을 보는 것 같이 정의와 쓰임세들이 잘 나와있다. 아래의 그림과 같이 친절하게 하나하나 설명이 나와있는 것을 볼 수 있다. 이 책에서 아쉬운 점이 하나 더 있다. 처음부터 끝까지 약간 딱딱한 느낌이 든다. 많은 수식과 모델링 개념들 그리고 다양한 유사도 비교를 포함한 알고리즘들에 대해선 설명이 잘 되어있다. 하지만 이런 개념들로만 끝나있다. 실제 약간의 소스들을 이용한 구현부분이나 활용된 사례들이 좀 들어가 있다면 보기 좋지 않을까라는 생각이 든다. 필자는 중간쯤 읽다가 내가 수학책을 읽고 있는 것인지 헤깔리기도 헀다..;; 아마 비즈니스라는 단어가 제목에 들어갔기 때문에 이렇게 딱딱한 느낌이 들게 만들지 않았나 라는 생각도 들었다. 아!! 그리고 처음부터 끝까지 흑백이다. 조금 컬러풀하게 나와도 되는 부분에서도 흑백이라서 눈은 즐겁지 못하다. 하지만 이 책은 데이터 분석 개념서로써 많은 마이닝 알고리즘들에 대해서 다루지는 못했지만 각각의 기본 개념 설명은 아주 충실하다. 표과 설명을 위한 그림도 충실히 들어가 있기 때문에 어느정도 데이터 분석에 대한 기본 개념이 있는 사람이라면 한번쯤 읽어봐도 좋을꺼 같다. |
서평을 마치고..
위에서 언급했던 이 책의 장점과 단점을 나열하자면 아래와 같다. [장점] - 용어 하나하나에 대한 정의와 설명이 세세하게 잘 되어있다. 마치 용어사전을 보는 것 같이 정의와 쓰임세들이 잘 나와있다. - 데이터 분석 개념서로써 많은 마이닝 알고리즘들에 대해서 다루지는 못했지만 각각의 기본 개념 설명은 아주 충실하다. - 표과 설명을 위한 그림도 충실히 들어가 있기 때문에 어느정도 데이터 분석에 대한 기본 개념이 있는 사람이라면 한번쯤 읽어봐도 좋을꺼 같다. [단점] - 각 목차들이 연관성이 조금 떨어지게 배치되어 데이터 분석을 처음 접하는 사람에게는 전체적으로 이해가 어려울 수 있다. - 조금 컬러풀하게 나와도 되는 부분에서도 흑백이라서 눈은 즐겁지 못하다. 게다가 수식이 많아서 그런지 조금 지루하고 딱딱하게 느낄수 있다. 이로써 이책의 리뷰를 마치고자 한다. 필자는 보안전공이다. 하지만 데이터 분석이라는 분야는 데이터를 항상 다루고 접하는 모든 연구원들이라면 알아두어야 하는 내용이라 생각한다. 그런 의미에서 막 데이터 분석 공부에 빠진 사람들에게 이 책은 자신의 지식을 좀더 촘촘히 다듬어서 빈틈이 없게 만들어줄 마감재 역할을 해줄 것이라 생각한다. |