1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Transformări logaritmice și de putere

În exercițiul anterior, ai comparat distribuțiile unui set de antrenament și ale unui set de testare din loan_data. Acest aspect este deosebit de relevant într-un interviu de machine learning, deoarece distribuția observată determină dacă este sau nu necesară aplicarea unor tehnici care să apropie distribuțiile caracteristicilor de o distribuție normală, pentru a nu viola ipotezele de normalitate.

În acest exercițiu, vei aplica transformarea logaritmică și cea de putere din modulul scipy.stats asupra caracteristicii Years of Credit History din loan_data, împreună cu funcția distplot() din seaborn, care reprezintă grafic atât distribuția, cât și estimarea densității kernel.

Toate pachetele necesare au fost deja importate.

Iată în ce punct al fluxului de lucru te afli:

Machine learning pipeline

Instrucțiuni 1/3

undefined XP
  • 1
    • Extrage coloana 'Years of Credit History' din loan_data și reprezintă grafic distribuția și estimarea densității kernel (kde) folosind distplot().
  • 2
    • Aplică o transformare logaritmică prin transformarea Box-Cox asupra cr_yrs și reprezintă grafic distribuția și kde-ul acesteia.
  • 3
    • Transformă coloana 'Years of Credit History' folosind argumentul Box-Cox pentru rădăcina pătrată și reprezintă grafic distribuția și kde-ul acesteia.