머신러닝 좀 한다, 데이터 분석 좀 한다 하는 사람들은 다 아는 케글! 나도 드디어 해봤다!
케글(Kaggle)이 뭐야?
케글은 2010년 만들어진 예측모델 및 데이터 분석 대회 플랫폼이다. Competition도 올라오고, Data만 따로 올라오기도 한다. 데이터를 분석해서 만든 예측 모델을 test 데이터를 통해 정확도를 확인할수도 있는 사이트다.
전 세계의 많은 사람들이 참여할 수 있어서 굉장히 핫한 플랫폼이다.
데이터 분석? 듣기만 해도 좀 어려운데.. 기초 지식 없이 시작할 수 있나?
결론부터 말하자면 기초 지식이 있어야 한다.
나도.. 잘 모르긴 하지만 통계 기본, 데이터 마이닝 분석 기법 등에 대한 이해와 동시에 그것을 코드로 구현할 줄 아는 능력이 필요하다. Python을 주로 사용하는데 pandas, matplotlib, numpy 등에 대한 이해가 정말 필수적으로 필요하다.
동시에 머신러닝을 돌리려고자 한다면 tensorflow도 필수적으로 다룰 수 있어야한다.
한마디로 아무것도 모르는 상태에서는 시작하기 쉽지 않다는 것!
하지만 이 내용을 알고 있다면, 시도를 하기에는 괜찮다. 이미 유명한 문제들은 많이 있고, 처음 스타트 하는 것을 도와주는 게시글도 많이 있다. 따라하다보면 금방 익숙해지기는 할 것 같다.
Kaggle 대표적인 Beginner 문제
- 타이타닉 생사 예측 문제 : https://www.kaggle.com/c/titanic
- 보스턴 집값 예측 문제 : https://www.kaggle.com/c/house-prices-advanced-regression-techniques
- 숫자 인식 문제 : https://subinium.github.io/kaggle-tutorial/
- 얼굴 인식 문제 : https://www.kaggle.com/c/facial-keypoints-detection
- 영화 리뷰 분석 문제 : https://www.kaggle.com/c/word2vec-nlp-tutorial
나도 열심히 해야지.. 뭔가 따라하면서 하니까 아직은 재미있은 것 같다. Work Hard! Think Big! Be Curious!!