Perbezaan Antara Pokok Keputusan dan Hutan Rawak

Isi kandungan:

Anonim

The perbezaan utama antara pokok keputusan dan hutan rawak ialah pohon keputusan adalah grafik yang menggunakan kaedah bercabang untuk menggambarkan setiap kemungkinan hasil keputusan sementara hutan rawak adalah sekumpulan pohon keputusan yang memberikan hasil akhir berdasarkan hasil dari semua keputusan pohonnya.

Pembelajaran mesin adalah aplikasi Kecerdasan Buatan, yang memberikan sistem kemampuan untuk belajar dan meningkatkan berdasarkan pengalaman masa lalu. Pokok keputusan dan hutan rawak adalah dua teknik dalam pembelajaran mesin. Pokok keputusan memetakan kemungkinan hasil dari serangkaian pilihan yang berkaitan. Ia popular kerana mudah dan senang difahami. Apabila set data menjadi lebih besar, satu keputusan tidak cukup untuk mencari ramalan. Hutan rawak, yang merupakan kumpulan pohon keputusan, adalah alternatif untuk masalah ini. Hasil hutan rawak berdasarkan hasil dari semua keputusannya.

Pokok Keputusan, Pembelajaran Mesin, Hutan Rawak

Apa itu Keputusan Pohon

Pokok keputusan adalah rajah bentuk pokok yang digunakan untuk menentukan jalan tindakan. Setiap cabang pokok mewakili kemungkinan keputusan, kejadian atau reaksi.

Terdapat beberapa istilah yang berkaitan dengan keputusan. Entropy adalah pengukuran ketidakpastian dalam set data. Setelah membelah set data, tahap entropi menurun kerana ketidakpastian menurun. Perolehan maklumat adalah penurunan entropi setelah melengkapkan set data. Penting untuk memisahkan data sedemikian rupa sehingga perolehan maklumat menjadi lebih tinggi. Keputusan akhir atau klasifikasi disebut simpul daun. Node paling atas atau utama disebut simpul akar. Set data harus dibahagi sehingga entropi akhir menjadi sifar.

Pokok keputusan mudah adalah seperti berikut.

Gambar 1: Pokok Keputusan

Pokok keputusan di atas mengelaskan satu set buah. Terdapat 4 biji anggur, 2 biji epal, dan 2 biji oren. Apabila mempertimbangkan diameter kurang dari 5, anggur dikategorikan dalam satu sisi sementara jeruk dan epal ke sisi lain. Anggur tidak dapat dikelaskan lebih jauh kerana ia mempunyai entropi sifar. Semasa mengkategorikan berdasarkan warna, iaitu, sama ada buahnya berwarna merah atau tidak, epal diklasifikasikan ke satu sisi sementara jeruk dikelaskan ke sisi yang lain. Oleh itu, pokok keputusan ini mengelaskan epal, anggur atau oren dengan ketepatan 100%.

Secara keseluruhan, pokok keputusan mudah difahami, lebih mudah ditafsirkan dan dilihat. Ia tidak memerlukan banyak penyediaan data. Ia dapat menangani data berangka dan kategoris. Sebaliknya, kebisingan dalam data boleh menyebabkan keterlaluan. Lebih-lebih lagi, modelnya juga tidak stabil kerana variasi kecil.

Apa itu Random Forest

Hutan rawak adalah kaedah yang beroperasi dengan membina banyak pohon keputusan semasa fasa latihan. Keputusan majoriti pokok adalah keputusan akhir hutan rawak. Contoh mudah adalah seperti berikut.

Anggaplah ada sekumpulan buah (ceri, epal, dan jeruk). Berikut adalah tiga pokok keputusan yang mengkategorikan ketiga-tiga jenis buah ini.

Gambar 2: Pokok keputusan 1

Gambar 3: Pokok Keputusan 2

Gambar 4: Pokok Keputusan 3

Buah baru yang diameternya 3 diberikan kepada model. Buah ini berwarna oren, dan tumbuh pada musim panas. Pokok keputusan pertama akan mengkategorikannya sebagai oren. Pokok keputusan kedua akan mengkategorikannya sebagai ceri manakala pokok keputusan ketiga akan mengkategorikannya sebagai oren. Apabila mempertimbangkan ketiga-tiga pokok, terdapat dua output untuk oren. Oleh itu, hasil akhir hutan rawak adalah oren.

Secara keseluruhan, hutan rawak memberikan hasil yang tepat pada set data yang lebih besar. Ia juga mengurangkan risiko overfitting.

Perbezaan Antara Pokok Keputusan dan Hutan Rawak

Definisi

Pohon keputusan adalah alat sokongan keputusan yang menggunakan grafik seperti model keputusan atau keputusan dan kemungkinan akibatnya, termasuk hasil peristiwa kebetulan, biaya sumber, dan utiliti. Hutan rawak adalah kaedah pembelajaran ensemble yang beroperasi dengan membina banyak pohon keputusan pada waktu latihan dan mengeluarkan kelas bergantung pada pokok masing-masing.

Overfitting

Terdapat kemungkinan overfitting di pohon keputusan. Penggunaan beberapa pokok di hutan rawak mengurangkan risiko terlalu banyak.

Ketepatan

Hutan rawak memberikan hasil yang lebih tepat daripada pokok keputusan.

Kerumitan

Pokok keputusan lebih mudah dan senang difahami, ditafsirkan dan dilihat daripada hutan rawak, yang relatif lebih kompleks.

Kesimpulannya

Perbezaan antara pohon keputusan dan hutan rawak adalah bahawa pohon keputusan adalah grafik yang menggunakan kaedah percabangan untuk menggambarkan setiap kemungkinan keputusan yang mungkin berlaku sedangkan hutan rawak adalah sekumpulan pohon keputusan yang memberikan hasil akhir berdasarkan hasil dari semua pokok keputusannya.

Rujukan:

1. Algoritma Hutan Rawak - Hutan Rawak Dijelaskan | Hutan Rawak dalam Pembelajaran Mesin, Simplilearn, 12 Mac 2018, Terdapat di sini.

Perbezaan Antara Pokok Keputusan dan Hutan Rawak