모델을 생성할 때, 데이터셋은 정말 중요하다. 다음은 train,test,validation 3가지 데이터셋에 대한 설명이다. 1) train 데이터셋 모델을 학습시킬 때 사용하는 데이터셋이다. train 데이터가 많으면 많을수록 모델이 학습할 수 있는 데이터가 많아 똑똑해질 수 있다. 2) test 데이터셋 앞서 RandomForest, DNN, CNN 모델의 코드를 보면, train데이터와 test데이터를 나누는 것을 확인할 수 있다. train_set, test_set = train_test_split(xy_data, test_size=0.3, random_state=123) 위 코드에서 test_size가 test데이터셋의 크기를 지정해주는 부분이다. 0.3이 의미하는 것은 총 데이터셋에서 tra..