ML
-
[핸즈온 머신러닝 2판] 테스트 세트 만들기ML 2020. 9. 6. 05:15
본 포스팅의 내용은 핸즈온 머신러닝 2판의 p.85~p.90의 2.3.4 테스트 세트 만들기의 보충 설명을 포함하고 있습니다. p.86을 보면 다음과 같이 train_set, test_set을 split한다. 이렇게 split한 test_set는 문제가 있다. 프로그램을 실행할 때마다 다른 test_set가 생성된다는 것이다. 책에서는 2가지 해결책을 제시하고 있다. 1. test_set를 최초 1회 실행할 때 저장하고, 이후 실행시에는 이를 불러온다.(파일 형태이거나 DB에 넣거나) 2. np.random.permutation()을 호출하기 전에 seed를 지정하는 방법(ex. np.random.seed(42) ) 하지만 저자는 이 두 가지 방법 모두 문제가 있다고 함. 어떤 케이스에서 문제가 발생하냐..