Regressione logistica per il tumore al seno
Nell'ultimo esercizio abbiamo fatto una prima valutazione dei dati. In questo esercizio definirai una suddivisione in training e test per un modello di regressione logistica su un insieme di dati sul tumore al seno. Questo è un primo passo importante per eseguire qualsiasi modello di Machine Learning.
Il dataset sul tumore al seno è un dataset di esempio di sklearn con diverse caratteristiche dei pazienti e un valore target che indica se il paziente ha o meno un tumore al seno. I dati sono forniti in formato dizionario: i dati principali sono in un array chiamato data, e i valori target in un array chiamato target. Quindi, cancer_data.data contiene le feature e cancer_data.target i target. I dati di esempio sono caricati come cancer_data insieme a pandas come pd. LogisticRegression è disponibile tramite sklearn.linear_model.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Definisci
Xeyusando rispettivamentedataetarget. - Imposta
X_trainey_traincome i primi 300 campioni diXey, rispettivamente, usandoX[:300]perX_train. - Imposta
X_testey_testcome i rimanenti elementi diXey(escludendo i primi 300 campioni), usandoX[300:]perX_test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define X and y
X = cancer_data.____
y = cancer_data.____
# Define training and testing data
X_train = X[____]
X_test = X[____]
y_train = y[____]
y_test = y[____]