//Pengantar Sains Data: Big Data dan Visualisasi Data

Pengantar Sains Data: Big Data dan Visualisasi Data

Buku Pengantar Sains Data: big data dan visualisasi data terdiri dari tiga bab. Bab pertama yaitu Menangani Data Besar Pada Satu Komputer menjelaskan Masalah utama yang akan dihadapi ketika bekerja dengan kumpulan data yang besar, solusi dari masalah tersebut, struktur data di sains data, modifikasi algoritma untuk data besar serta tools python yang membantu Anda menangani kumpulan data yang besar. Bab kedua menjelaskan proses big data. Pada bab ini akan dibahas dua framework sains data untuk data besar yaitu Hadoop dan Spark. Framework tersebut bisa dikombinasikan dengan bahasa Python seperti pywebhdfs untuk hadoop dan PySpark untuk spark Bab terakhir menjelaskan tentang Visualisasi data kepada End User.  Bab ini berfokus pada bagian terakhir dari proses sains data, dan tujuan kita adalah untuk membangun aplikasi sains data di mana pengguna akhir diberikan dasbor interaktif. Setelah melalui semua langkah proses sains data, kita akan mendapatkan data yang bersih, sering kali dipadatkan atau padat informasi. Dengan cara ini kita dapat meminta lebih sedikit data dan mendapatkan wawasan yang kita inginkan.

DOWNLOAD

PRE-ORDER