Kami memutuskan untuk menulis konten ini karena, dalam beberapa bulan terakhir, banyak calon profesional sains data yang mengajukan pertanyaan ini kepada penasihat proyek kami untuk memulai karier sains data -
“Saya ingin belajar ilmu data tetapi saya tidak tahu harus mulai dari mana.”
“Saya tahu python untuk pengembangan web, tetapi bagaimana cara belajar python untuk ilmu data.”
“Apa cara terbaik untuk mempelajari ilmu data?”
“Bagaimana cara mempelajari ilmu data dari awal?”
“Di mana tempat terbaik untuk belajar ilmu data?”
Tujuan dari blog ini adalah untuk membuat Anda mengambil langkah yang benar dalam perjalanan ilmu data Anda.
Anda dapat bangkit dan mewujudkan keinginan Anda untuk menjadi seorang data scientist terlepas dari apakah Anda memiliki latar belakang yang bagus, gelar yang bagus, atau tidak. Siapa pun bisa menjadi ilmuwan data terlepas dari peran pekerjaan saat ini atau pengalaman sebelumnya. Tantangan terbesar adalah mengetahui dari mana harus mulai belajar ilmu data. Ada banyak sekali sumber daya sains data online untuk mempelajari sains data, tetapi penting untuk menyusun jalur karier sains data secara logis. Yang diperlukan hanyalah bekerja keras, mempelajari keterampilan ilmu data yang diperlukan, dan menunjukkan bahwa Anda dapat memberikan hasil melalui proyek ilmu data langsung .
Bagaimana Cara Mempelajari Ilmu Data?
Sebelum Anda tersesat di lubang kelinci sains data, lihat 3 tip penting kami tentang cara mempelajari sains data dari awal sendiri dengan lebih cepat –
1) Pelajari Ilmu Data dengan Melakukan. Selalu kerjakan proyek ilmu data untuk mempelajari suatu konsep.
Mempraktikkan proyek dan belajar sendiri adalah satu-satunya hal yang dapat membuat Anda menjadi pahlawan super ilmu data.
Cara terbaik untuk mempelajari ilmu data adalah dengan mengerjakan proyek sehingga Anda dapat memperoleh keterampilan ilmu data yang dapat langsung diterapkan dan berguna dari perspektif implementasi di dunia nyata. Semakin cepat Anda mulai mengerjakan berbagai proyek ilmu data, semakin cepat Anda mempelajari konsep terkait. Bahkan jika Anda membaca buku lengkap tentang algoritme pembelajaran mesin dan topik seperti regresi linier tampak mudah - sehingga bahkan orang yang naif pun dapat menerapkannya - Anda masih akan menggaruk-garuk kepala saat diberi masalah bisnis dunia nyata untuk diselesaikan. mengimplementasikan algoritma pembelajaran mesin regresi linier untuk pertama kalinya. Anda akan berpikir, “tunggu apa rumus untuk memperkirakan koefisien dalam regresi linier? “Seperti yang dinyatakan oleh prinsip Plastisitas Otak- “Gunakan atau Hilangkan”, prinsip ini berlaku saat mempelajari ilmu data. Bangun proyek ilmu data untuk setiap konsep yang Anda pelajari melalui buku atau sumber ilmu data online lainnya. Jika Anda tidak secara aktif menerapkan konsep ilmu data yang Anda pelajari, Anda tidak akan siap untuk melakukan pekerjaan ilmu data yang sebenarnya di tempat kerja. Proyek adalah cara terbaik untuk mempelajari ilmu data dan titik awal yang bagus.
2) Pahami dasar-dasar ilmu data untuk manfaat jangka panjang.
ilmu data lanjutan dan Mempelajari dasar-dasar ilmu data harus selalu menjadi prioritas Anda: semakin baik Anda memahaminya, semakin mudah untuk mempelajari konsep pembelajaran mesin lainnya . Pahami komponen dan konsep yang digunakan dalam ilmu data alih-alih langsung ke kursus. Pecahkan setiap konsep menjadi bagian-bagian yang lebih kecil, pahami teori di baliknya, dan praktikkan dengan menerapkannya. Memahami dasar-dasar adalah langkah penting dalam mempelajari ilmu data, jadi jangan mengabaikannya. Kami membagi dasar-dasar ilmu data menjadi dua kategori inti: Matematika dan Pemrograman.
Klik Disini untuk Mendaftar Kelas: Data Science: Transformers for Natural Language Processing
- Terapkan transformer ke tugas dunia nyata hanya dengan beberapa baris kode
- Sempurnakan transformer pada kumpulan data Anda sendiri dengan pembelajaran transfer
- Analisis sentimen, deteksi spam, klasifikasi teks
- NER (pengenalan entitas bernama), penandaan bagian ucapan
- Bangun pemintal artikel Anda sendiri untuk SEO
- Hasilkan teks seperti manusia yang dapat dipercaya
- Terjemahan mesin saraf dan peringkasan teks
- Menjawab pertanyaan (misalnya SQuAD)
- Klasifikasi tanpa tembakan
- Pahami perhatian diri dan teori mendalam di balik transformer
- Terapkan transformer dari awal
- Gunakan transformer dengan Tensorflow dan PyTorch
- Pahami BERT, GPT, GPT-2, dan GPT-3, dan di mana menerapkannya
- Memahami encoder, decoder, dan arsitektur seq2seq
- Kuasai library Hugging Face Python
- Video sesuai permintaan 18 jam
- 1 artikel
- Akses seumur hidup penuh
- Akses di ponsel dan TV
- Sertifikat kelulusan
Matematika Dasar untuk Ilmu Data
- Aljabar linier
- Kalkulus
- Statistik – Memahami jenis regresi, teori probabilitas, pengelompokan, klasifikasi, pemikiran Bayesian, dan Statistik Deskriptif.
Dibandingkan dengan bahasa pemrograman lain, lebih disukai mempelajari Python untuk ilmu data karena telah menjadi bahasa pemrograman de-facto untuk para profesional analitik diikuti oleh R. Terlepas dari apakah Anda berencana untuk belajar Python atau ilmu data atau R untuk ilmu data , berikut adalah beberapa konsep pemrograman dasar yang harus Anda pahami –
- Variabel dan Struktur Data
- Fungsi
- Loop
- Objek
3) Cari lebih banyak sumber ilmu data online gratis. Ada banyak konten ilmu data.
Jika ada konsep matematika atau statistik tertentu yang tidak masuk akal bagi Anda, baik itu di buku, atau di kelas, pertahankan kepercayaan diri Anda dan cari sumber online alternatif lainnya untuk mempelajari konsep ilmu data apa pun yang diberikan. Ada banyak sumber online untuk mempelajari ilmu data secara gratis. Setiap orang belajar secara berbeda, dan hanya karena Anda tidak dapat mempelajari suatu konsep melalui satu sumber tidak berarti Anda tidak dapat mempelajarinya. Ada banyak konten online untuk mempelajari ilmu data baik itu blog penjelasan, tutorial, video, atau podcast yang akan membuat konsep yang ada sangat jelas untuk Anda pahami.
Nasihat Ahli tentang Cara Mempelajari Ilmu Data Dari Awal Sendiri
Kami berkesempatan untuk berbicara dengan pakar Kaggle, Sharan Kumar Ravindran, yang memutuskan untuk berbagi jalur karier ilmu datanya dengan kami. Sharan adalah Ilmuwan Data terkemuka yang saat ini bekerja di Deloitte Australia. Dia telah menulis dua buku tentang topik terkait Ilmu Data , dengan lebih dari 2200 eksemplar terjual secara global dan bukunya secara konsisten berada di peringkat 500 teratas dalam kategori khusus Pembelajaran Mesin di Amazon. Sharan berada di peringkat 1 persentil teratas di Kaggle, komunitas ilmuwan data terbesar di dunia dan berpengalaman dalam pemrograman di R dan Python . Dalam wawancara ini, dia berbicara tentang pentingnya memiliki seorang mentor dan dengan terus terang menceritakan bagaimana mentornya membantunya membentuk karir ilmu datanya.
Bisakah Anda menjelaskan kepada kami apa itu pakar kompetisi Kaggle, apa saja berbagai level dan bagaimana Anda mencapai status persentil satu teratas?
Saya ingin memulai dengan memberi tahu Anda bahwa saya tidak lagi aktif di Kaggle. Saya pikir kompetisi terakhir saya adalah sekitar lima tahun dari sekarang. Tetapi poin yang saya terima saat saya aktif telah membantu saya untuk mempertahankan posisi saya. Peringkat tertinggi saya mungkin berada di persentil 0,5 teratas dan peringkat saya saat ini mungkin antara persentil 3-4. Saya mulai berpartisipasi dalam hackathon sains data Kaggle dengan niat untuk belajar. Kaggle adalah platform yang bagus untuk siapa saja yang mencoba mempelajari ilmu data dari nol sendiri. Ini sangat membantu saya memahami berbagai algoritme pembelajaran mesin, aplikasinya, serta kumpulan data yang sesuai untuk bekerja dengan berbagai algoritme. Sebagai hasil dari keterlibatan saya yang intensif, saya mempelajari hal-hal dari Kaggle yang diperoleh orang melalui pengalaman. Saya memastikan untuk terlibat aktif dalam setidaknya satu kompetisi ilmu data Kaggle kapan saja. Saya akan menghabiskan setidaknya dua jam setiap hari untuk fokus pada pembelajaran saya dari kompetisi tertentu. Saya membaca hampir setiap postingan, serta diskusi di berbagai forum tentang model pembelajaran mesin dan kumpulan datanya. Ini membantu saya untuk unggul tidak hanya di Kaggle tetapi juga sebagai ilmuwan data.
Berapa banyak kompetisi ilmu data yang biasanya Anda miliki untuk mengirimkan solusi agar Anda mendapatkan peringkat tinggi, katakanlah - ke persentil 5 teratas?
Setidaknya ada 1000 pengguna yang berpartisipasi dalam kompetisi ilmu data yang khas di Kaggle, jadi untuk masuk ke lima persentil teratas membutuhkan waktu. Saya biasanya mulai pada waktu peluncuran kompetisi karena itu memberi saya landasan yang cukup untuk menyempurnakan model pembelajaran mesin. Frekuensi keikutsertaan saya dapat disimpulkan dari data ini - kompetisi yang saya peringkatkan dalam persentil 5-10 teratas, saya akan membuat setidaknya 50 kiriman atau terkadang bahkan 100 kiriman. Dari apa yang saya ingat ada batasan 3 pengiriman per hari.
EmoticonEmoticon