Bagaimana cara menghapus baris duplikat?
Perintah lain yang sering digunakan dengan sort adalah uniq,
yang bertugas menghapus baris yang terduplikasi.
Lebih spesifik lagi,
perintah ini menghapus baris duplikat yang berdampingan.
Jika sebuah file berisi:
2017-07-03
2017-07-03
2017-08-03
2017-08-03
maka uniq akan menghasilkan:
2017-07-03
2017-08-03
namun jika berisi:
2017-07-03
2017-08-03
2017-07-03
2017-08-03
maka uniq akan mencetak keempat baris tersebut.
Alasannya adalah uniq dibuat untuk bekerja dengan file yang sangat besar.
Untuk menghapus baris yang tidak berdampingan dari sebuah file,
perintah ini harus menyimpan seluruh file dalam memori
(atau setidaknya,
semua baris unik yang sudah ditemui).
Dengan hanya menghapus duplikat yang berdampingan,
perintah ini hanya perlu menyimpan baris unik terbaru di memori.
Latihan ini adalah bagian dari kursus
Pengantar Shell
Petunjuk latihan
Tulis sebuah pipeline untuk:
- mengambil kolom kedua dari
seasonal/winter.csv, - menghapus kata "Tooth" dari output sehingga hanya nama gigi yang ditampilkan,
- mengurutkan output sehingga semua kemunculan sebuah nama gigi saling berdampingan; dan
- menampilkan setiap nama gigi satu kali beserta hitungannya seberapa sering muncul.
Awal pipeline Anda sama seperti latihan sebelumnya:
cut -d , -f 2 seasonal/winter.csv | grep -v Tooth
Perluas dengan perintah sort, dan gunakan uniq -c untuk menampilkan baris unik beserta jumlah kemunculannya alih-alih menggunakan uniq dan wc.
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga