IniziaInizia gratis

Regressione logistica per il tumore al seno

Nell'ultimo esercizio abbiamo fatto una prima valutazione dei dati. In questo esercizio definirai una suddivisione in training e test per un modello di regressione logistica su un insieme di dati sul tumore al seno. Questo è un primo passo importante per eseguire qualsiasi modello di Machine Learning.

Il dataset sul tumore al seno è un dataset di esempio di sklearn con diverse caratteristiche dei pazienti e un valore target che indica se il paziente ha o meno un tumore al seno. I dati sono forniti in formato dizionario: i dati principali sono in un array chiamato data, e i valori target in un array chiamato target. Quindi, cancer_data.data contiene le feature e cancer_data.target i target. I dati di esempio sono caricati come cancer_data insieme a pandas come pd. LogisticRegression è disponibile tramite sklearn.linear_model.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci X e y usando rispettivamente data e target.
  • Imposta X_train e y_train come i primi 300 campioni di X e y, rispettivamente, usando X[:300] per X_train.
  • Imposta X_test e y_test come i rimanenti elementi di X e y (escludendo i primi 300 campioni), usando X[300:] per X_test.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Define X and y 
X = cancer_data.____
y = cancer_data.____

# Define training and testing data
X_train = X[____]
X_test = X[____]
y_train = y[____]
y_test = y[____] 
Modifica ed esegui il codice