1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do uczenia głębokiego z Keras

Connected

ćwiczenie

Przygotowanie obrazu wejściowego

Oryginalny model ResNet50 był trenowany na obrazach o rozmiarze 224 x 224 pikseli z zastosowaniem kilku operacji wstępnego przetwarzania – m.in. odejmowania średniej wartości piksela wyznaczonej na zbiorze treningowym. Aby model działał poprawnie, obrazy, na których chcesz wykonywać predykcje, musisz przetworzyć w dokładnie taki sam sposób.

Podczas predykcji na pojedynczym obrazie konieczne jest dopasowanie go do kształtu wejściowego modelu, który wygląda następująco: (batch-size, width, height, channels). Funkcja np.expand_dims z parametrem axis = 0 dodaje wymiar batch-size, oznaczający, że do predykcji przekazywany jest jeden obraz. Wartość tego wymiaru wynosi 1, ponieważ przewidujemy tylko dla jednego obrazu.

Przejdziesz teraz przez kolejne kroki przetwarzania wstępnego i przygotujesz zdjęcie psa o imieniu Ivy tak, aby mogło zostać sklasyfikowane przez ResNet50.

Instrukcje

100 XP
  • Zaimportuj image z tensorflow.keras.preprocessing oraz preprocess_input z tensorflow.keras.applications.resnet50.
  • Wczytaj obraz z odpowiednim parametrem target_size dla swojego modelu.
  • Przekształć go w tablicę za pomocą image.img_to_array().
  • Przetwórz wstępnie img_expanded w taki sam sposób, w jaki przetwarzano oryginalne obrazy treningowe ResNet50 – użyj do tego funkcji preprocess_input().