Perbezaan Antara Regresi Linear dan Regresi Logistik

Isi kandungan:

Anonim

The perbezaan utama antara regresi linear dan regresi logistik adalah bahawa regresi linear digunakan untuk meramalkan nilai berterusan manakala regresi logistik digunakan untuk meramalkan nilai diskrit.

Sistem pembelajaran mesin dapat meramalkan hasil masa depan berdasarkan latihan input masa lalu. Terdapat dua jenis pembelajaran mesin yang disebut pembelajaran diawasi dan pembelajaran tanpa pengawasan. Regresi dan klasifikasi berada di bawah pembelajaran yang diselia sementara pengelompokan berada di bawah pembelajaran yang tidak diawasi. Algoritma pembelajaran yang diawasi menggunakan data berlabel untuk melatih set data. Regresi linear dan regresi logistik adalah dua jenis algoritma pembelajaran yang diselia. Regresi linear digunakan apabila pemboleh ubah bersandar adalah berterusan, dan modelnya linear. Regresi logistik digunakan apabila pemboleh ubah bersandar adalah diskrit, dan modelnya tidak linear.

Regresi Linear, Regresi Logistik, Pembelajaran Mesin

Apa itu Regresi Linear

Regresi linear mendapati hubungan antara pemboleh ubah bebas dan bersandar. Kedua-dua mereka bersebelahan. Pemboleh ubah bebas adalah pemboleh ubah yang tidak diubah oleh pemboleh ubah lain. Ia dilambangkan dengan x. Terdapat juga beberapa pemboleh ubah bebas seperti x1, x2, x3, dan lain-lain. Pemboleh ubah bersandar berubah mengikut pemboleh ubah bebas, dan dilambangkan dengan y.

Apabila terdapat satu pemboleh ubah bebas, persamaan regresi adalah seperti berikut.

y = b0 + b1x

Sebagai contoh, anggap bahawa x mewakili hujan dan y mewakili hasil tanaman.

Gambar 1: Regresi Linear

Set data akan kelihatan seperti di atas. Kemudian, garis yang merangkumi sebahagian besar titik data dipilih. Garis ini mewakili nilai yang diramalkan.

Gambar 2: Jarak antara titik data sebenar dan nilai yang diramalkan

Kemudian, jarak dari setiap titik data ke garis dijumpai seperti yang ditunjukkan dalam grafik di atas. Ini adalah jarak antara nilai sebenar dan nilai yang diramalkan. Jarak ini juga dikenali sebagai kesalahan atau sisa. Garis paling sesuai harus mempunyai jumlah kesalahan yang paling sedikit. Apabila nilai hujan baru diberikan (x), adalah mungkin untuk mencari hasil tanaman yang sesuai (y) menggunakan garis ini.

Di dunia nyata, terdapat pelbagai pemboleh ubah bebas (x1, x2, x3…). Ini dipanggil regresi linear berganda. Persamaan regresi linear berganda adalah seperti berikut.

Apa itu Regresi Logistik

Regresi logistik boleh digunakan untuk mengklasifikasikan dua kelas. Ia juga dikenali sebagai pengkelasan binari. Memeriksa sama ada e-mel adalah spam atau tidak meramalkan sama ada pelanggan akan membeli produk atau tidak, meramalkan sama ada kemungkinan untuk mendapatkan promosi atau tidak adalah beberapa contoh regresi logistik yang lain.

Gambar 3: Regresi Logistik

Anggap bahawa bilangan jam pelajar yang dikaji setiap hari adalah pemboleh ubah tidak bersandar. Bergantung pada itu, kemungkinan lulus peperiksaan dikira. Nilai 0.5 dianggap sebagai ambang. Apabila jumlah jam baru diberikan, adalah mungkin untuk mencari kebarangkalian yang sesuai untuk lulus peperiksaan menggunakan grafik ini. Sekiranya kebarangkalian melebihi 0.5, ia dianggap sebagai 1 atau lulus. Sekiranya kebarangkalian di bawah 0.5, maka ia dianggap sebagai 0 atau gagal.

Menerapkan persamaan regresi linear pada fungsi sigmoid akan memberikan persamaan regresi logistik.

Fungsi sigmoid adalah

Perkara penting lain yang perlu diperhatikan adalah bahawa regresi logistik hanya berlaku untuk mengelaskan 2 kelas. Ia tidak digunakan untuk klasifikasi multikelas.

Perbezaan Antara Regresi Linear dan Regresi Logistik

Definisi

Regresi linear adalah pendekatan linear yang memodelkan hubungan antara pemboleh ubah bersandar dan satu atau lebih pemboleh ubah bebas. Sebaliknya, regresi logistik adalah model statistik yang meramalkan kebarangkalian hasil yang hanya dapat memiliki dua nilai.

Penggunaan

Walaupun regresi linier digunakan untuk menyelesaikan masalah regresi, regresi logistik digunakan untuk menyelesaikan masalah klasifikasi (klasifikasi binari).

Metodologi

Regresi linear menganggarkan pemboleh ubah bersandar apabila terdapat perubahan dalam pemboleh ubah bebas. Regresi logistik mengira kemungkinan kejadian berlaku. Ini adalah satu perbezaan penting antara regresi linear dan regresi logistik.

Nilai Keluaran

Juga, dalam regresi linear, nilai output adalah berterusan. Dalam regresi logistik, nilai output adalah diskrit.

Model

Walaupun regresi linier menggunakan garis lurus, regresi logistik menggunakan keluk S atau fungsi sigmoid. Ini adalah perbezaan penting lain antara regresi linier dan regresi logistik.

Contoh

Meramalkan KDNK sebuah negara, meramalkan harga produk, meramalkan harga jual rumah, ramalan skor adalah beberapa contoh regresi linear. Meramalkan sama ada e-mel adalah spam atau tidak, meramalkan sama ada transaksi kad kredit adalah penipuan atau tidak, meramalkan sama ada pelanggan akan mengambil pinjaman atau tidak adalah beberapa contoh regresi logistik.

Kesimpulannya

Perbezaan antara regresi linier dan regresi logistik adalah bahawa regresi linier digunakan untuk memprediksi nilai berterusan sementara regresi logistik digunakan untuk memprediksi nilai diskrit. Secara ringkas, regresi linear digunakan untuk regresi sementara regresi logistik digunakan untuk klasifikasi.

Rujukan:

1. Analisis Regresi Linear | Regresi Linear di Python | Algoritma Pembelajaran Mesin | Simplilearn, 26 Mac 2018, Terdapat di sini.2. Regresi Logistik | Regresi Logistik di Python | Algoritma Pembelajaran Mesin | Simplilearn, 22 Mac 2018, Terdapat di sini.

Gambar Kesopanan:

1. "Regresi Linear" Oleh Sewaqu - Karya sendiri, Domain Awam) melalui Wikimedia Commons2. "Residual untuk Linear Regression Fit" Oleh Thomas.haslwanter - Karya sendiri (CC BY-SA 3.0) melalui Wikimedia Commons3. "Logistik-kurva" Oleh Qef (bicara) - Dibuat dari awal dengan gnuplot (Domain Awam) melalui Wikimedia Commons

Perbezaan Antara Regresi Linear dan Regresi Logistik