10 Kumpulan Open Datasets untuk Regresi Linier
Wednesday, May 6, 2020
Add Comment
Laptopinformatika.com - Setiap ilmuwan data kemungkinan harus melakukan tugas-tugas regresi linier dan proses pemodelan prediktif di beberapa titik dalam studi atau karier mereka. Bagi Anda yang ingin mempelajari lebih lanjut tentang topik ini atau menyelesaikan beberapa tugas sampel, artikel ini akan memperkenalkan 10 dataset terbuka untuk regresi linier. Selain itu, beberapa kumpulan data dalam daftar ini menyertakan tugas regresi untuk Anda lengkapi dengan data.
Read More : Bagaimana Cara Memilih Krim Anti Kerut yang Sempurna?
Kumpulan Data Regresi Linier untuk Pembelajaran Mesin
1. Regresi Linier Kanker
Dataset ini mencakup data yang diambil dari cancer.gov tentang kematian akibat kanker di Amerika Serikat. Seiring dengan dataset, penulis menyertakan langkah-langkah penuh tentang bagaimana mereka bersumber dan menyiapkan data, analisis eksplorasi mereka, pemilihan model, diagnostik, dan interpretasi.
2. Data CDC: Nutrisi, Aktivitas Fisik, Obesitas
Dari Sistem Surveilans Faktor Risiko Perilaku di CDC, set data ini mencakup informasi tentang aktivitas fisik, berat badan, dan diet orang dewasa rata-rata.
3. Dataset Pasar Ikan
Dibangun untuk regresi linier berganda dan analisis multivariat, Dataset Pasar Ikan berisi informasi tentang spesies ikan umum dalam penjualan pasar. Dataset mencakup spesies ikan, berat, panjang, tinggi, dan lebar.
4. Biaya Asuransi Medis
Dataset ini terinspirasi oleh buku Machine Learning with R oleh Brett Lantz. Data tersebut berisi informasi medis dan biaya yang ditagih oleh perusahaan asuransi kesehatan. Ini berisi 1338 baris data dan kolom berikut: usia, jenis kelamin, BMI, anak-anak, perokok, wilayah, biaya asuransi.
5. Dataset Bursa Efek New York
Dibuat sebagai sumber daya untuk analisis teknis, set data ini berisi data historis dari pasar saham New York. Dataset datang dalam empat file CSV: harga, penyesuaian harga, sekuritas, dan fundamental. Dengan menggunakan data ini, Anda dapat bereksperimen dengan pemodelan prediktif, regresi linier berguling, dan banyak lagi.
6. Tantangan Regresi OLS
Tantangan regresi OLS menugasi Anda memprediksi tingkat kematian akibat kanker untuk negara bagian AS. Dataset berisi data dari cancer.gov, clinicaltrials.gov, dan American Community Survey. Itu dalam format CSV dan mencakup informasi berikut tentang kanker di AS: tingkat kematian, kasus yang dilaporkan, nama county AS, pendapatan per county, populasi, demografi, dan banyak lagi.
7. Prediksi Harga Real Estat
Dataset real estat ini dibangun untuk analisis regresi, regresi linier, regresi berganda, dan model prediksi. Ini termasuk tanggal pembelian, umur rumah, lokasi, jarak ke stasiun MRT terdekat, dan harga rumah dari satuan luas.
8. Kualitas Anggur Merah
Dari Repositori Pembelajaran Mesin UCI, dataset ini dapat digunakan untuk pemodelan regresi dan tugas klasifikasi. Dataset mencakup info tentang sifat kimia berbagai jenis anggur dan bagaimana kaitannya dengan kualitas keseluruhan.
Read More : Bagaimana Mengonversi MKV ke MP4, Cepat, Sederhana dan Gratis!
9. Vehicle Dataset dari CarDekho
Dataset yang berguna untuk prediksi harga, dataset kendaraan ini mencakup informasi tentang mobil dan motor yang terdaftar di CarDekho.com. Data tersebut ada dalam file CSV yang mencakup kolom berikut: model, tahun, harga jual, harga showroom, penggerak kilometer, tipe bahan bakar, tipe penjual, transmisi, dan jumlah pemilik sebelumnya.
10. Statistik WHO tentang Harapan Hidup
Dataset ini berisi informasi yang dihimpun oleh Organisasi Kesehatan Dunia dan PBB untuk melacak faktor-faktor yang mempengaruhi harapan hidup. Data berisi 2938 baris dan 22 kolom. Kolom meliputi: negara, tahun, status perkembangan, kematian orang dewasa, harapan hidup, kematian bayi, konsumsi alkohol per kapita, pengeluaran negara untuk kesehatan, cakupan imunisasi, IMT, kematian di bawah 5 tahun, kematian akibat HIV / AIDS, PDB, populasi, kondisi tubuh, informasi pendapatan, dan pendidikan.
0 Response to "10 Kumpulan Open Datasets untuk Regresi Linier"
Post a Comment