PER 버퍼에서 샘플링하기

에이전트를 학습시키기 위해 Prioritized Experience Buffer 클래스를 사용하려면, 아직 .sample() 메서드를 구현해야 합니다. 이 메서드는 추출하려는 샘플의 크기를 인수로 받아서, 샘플링된 전이를 tensors 형태로 반환하고, 해당 전이의 메모리 버퍼 내 인덱스와 중요도 가중치도 함께 돌려줍니다.

용량이 10인 버퍼가 미리 환경에 로드되어 있으니, 여기에서 샘플링해 보세요.