Przygotowanie obrazu wejściowego

Oryginalny model ResNet50 był trenowany na obrazach o rozmiarze 224 x 224 pikseli z zastosowaniem kilku operacji wstępnego przetwarzania – m.in. odejmowania średniej wartości piksela wyznaczonej na zbiorze treningowym. Aby model działał poprawnie, obrazy, na których chcesz wykonywać predykcje, musisz przetworzyć w dokładnie taki sam sposób.

Podczas predykcji na pojedynczym obrazie konieczne jest dopasowanie go do kształtu wejściowego modelu, który wygląda następująco: (batch-size, width, height, channels). Funkcja np.expand_dims z parametrem axis = 0 dodaje wymiar batch-size, oznaczający, że do predykcji przekazywany jest jeden obraz. Wartość tego wymiaru wynosi 1, ponieważ przewidujemy tylko dla jednego obrazu.

Przejdziesz teraz przez kolejne kroki przetwarzania wstępnego i przygotujesz zdjęcie psa o imieniu Ivy tak, aby mogło zostać sklasyfikowane przez ResNet50.

Zaimportuj image z tensorflow.keras.preprocessing oraz preprocess_input z tensorflow.keras.applications.resnet50.
Wczytaj obraz z odpowiednim parametrem target_size dla swojego modelu.
Przekształć go w tablicę za pomocą image.img_to_array().
Przetwórz wstępnie img_expanded w taki sam sposób, w jaki przetwarzano oryginalne obrazy treningowe ResNet50 – użyj do tego funkcji preprocess_input().

ćwiczenie

Przygotowanie obrazu wejściowego

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie