21+ kho lưu trữ GitHub để làm chủ khoa học dữ liệu, khoa học máy tính, kỹ sư dữ liệu, phân tích dữ liệu
Học khoa học dữ liệu thông qua các khóa học tương tác, sách, hướng dẫn, ví dụ về mã, dự án và các khóa học miễn phí dựa trên chương trình giảng dạy hàng đầu của trường đại học.
Ngoài ra, hãy truy cập các câu hỏi phỏng vấn và các phương pháp hay nhất bởi Abid Ali Awan , Trợ lý biên tập viên KDnuggets vào ngày 11 tháng 7 năm 2024 trong Khoa học dữ liệu.
Học khoa học dữ liệu thông qua các khóa học hoặc video trên YouTube có thể trở nên đơn điệu vì nó thường liên quan đến việc tiếp nhận thông tin một cách thụ động. Bạn không phải nhúng tay vào, thử nghiệm hoặc thực sự xây dựng bất cứ thứ gì. Bạn chỉ đơn giản là tiếp thu nội dung từ màn hình. Nhưng nếu tôi nói với bạn rằng có một cách hấp dẫn và hiệu quả hơn để nắm bắt các công cụ và khái niệm khoa học dữ liệu thì sao? Đúng vậy. Hôm nay, chúng ta sẽ khám phá 10 kho lưu trữ GitHub sẽ giúp bạn nắm vững các khái niệm khoa học dữ liệu thông qua các khóa học tương tác, sách, hướng dẫn, ví dụ về mã, dự án, khóa học miễn phí dựa trên chương trình giảng dạy hàng đầu của trường đại học, câu hỏi phỏng vấn và các phương pháp hay nhất.
1.Virgilio: Your Data Science Mentor Hướng dẫn toàn diện về học Khoa học Dữ liệu trực tuyến, cung cấp nội dung có cấu trúc, hướng dẫn và tài nguyên cho người mới bắt đầu.
Liên kết: Virgilio Số lượng forks: 1.1k Số lượng stars: 6.5k Số người theo dõi: 6.5k
2.Python Data Science Handbook Toàn bộ nội dung sách "Python Data Science Handbook" dưới dạng Jupyter Notebooks, bao gồm các thư viện quan trọng như NumPy, pandas, Matplotlib, Scikit-Learn.
Liên kết: Python Data Science Handbook Số lượng forks: 7.2k Số lượng stars: 38.5k Số người theo dõi: 38.5k
3.Microsoft:Data Science for Beginners Chương trình học 10 tuần với 20 bài học từ Microsoft, cung cấp kiến thức cơ bản và dự án thực hành về Khoa học Dữ liệu.
Liên kết: Data Science for Beginners Số lượng forks: 4.1k Số lượng stars: 12.5k Số người theo dõi: 12.5k
4.Data Science IPython Notebooks Bộ sưu tập Jupyter notebooks về các chủ đề Khoa học Dữ liệu như học sâu, học máy, phân tích dữ liệu và Python cơ bản.
Liên kết: Data Science IPython Notebooks Số lượng forks: 6.8k Số lượng stars: 25.5k Số người theo dõi: 25.5k
5.Applied Machine Learning Tổng hợp các bài báo và blog kỹ thuật về việc áp dụng học máy trong môi trường thực tế, tập trung vào triển khai ML trong sản xuất.
Liên kết: Applied Machine Learning Số lượng forks: 2.3k Số lượng stars: 25.5k Số người theo dõi: 25.5k
6.Path to a Free Self-Taught Education in Data Science Chương trình học toàn diện cho việc tự học Khoa học Dữ liệu, bao gồm các khóa học miễn phí, sách giáo khoa và tài nguyên từ toán học cơ bản đến học máy nâng cao.
Liên kết: Path to a Free Self-Taught Education in Data Science Số lượng forks: 2.1k Số lượng stars: 14.5k Số người theo dõi: 14.5k
7.The Open Source Data Science Masters Chương trình học mã nguồn mở chuẩn bị cho vai trò nhà khoa học dữ liệu, cung cấp tài nguyên giáo dục chất lượng cao miễn phí.
Liên kết: The Open Source Data Science Masters Số lượng forks: 7.2k Số lượng stars: 24.5k Số người theo dõi: 24.5k
8.Awesome Data Science Danh sách tổng hợp các tài nguyên xuất sắc về Khoa học Dữ liệu, bao gồm hướng dẫn, sách, phần mềm và công cụ.
Liên kết: Awesome Data Science Số lượng forks: 2.1k Số lượng stars: 21.5k Số người theo dõi: 21.5k
9.Data Science Interview Questions and Answers Bộ sưu tập các câu hỏi và câu trả lời phỏng vấn Khoa học Dữ liệu, hữu ích cho việc chuẩn bị phỏng vấn.
Liên kết: Data Science Interview Questions and Answers Số lượng forks: 2.1k Số lượng stars: 12.5k Số người theo dõi: 12.5k
10.Cookiecutter Data Science Cung cấp cấu trúc dự án chuẩn cho các dự án Khoa học Dữ liệu, giúp tổ chức, tái tạo và chia sẻ công việc hiệu quả.
Liên kết: Cookiecutter Data Science Số lượng forks: 2.5k Số lượng stars: 8.4k Số người theo dõi: 8.4k
Ngoài ra, dựa trên thông tin từ internet và các blog như Medium và Towards Data Science, dưới đây là danh sách 7 khóa học Khoa học Dữ liệu hàng đầu trên GitHub được đề xuất bởi Fatos Morina:
11.CS109 Data Science Khóa học này được cung cấp bởi Đại học Harvard, bao gồm các tài liệu giảng dạy về Khoa học Dữ liệu.
Liên kết: CS109 Data Science Số lượng forks: 1.5k Số lượng stars: 5.9k Số người theo dõi: 5.9k
12.Data Science Specialization Đây là khóa học từ Đại học Johns Hopkins, bao gồm các tài liệu và bài tập về Khoa học Dữ liệu.
Liên kết: Data Science Specialization Số lượng forks: 6.1k Số lượng stars: 8.1k Số người theo dõi: 8.1k
13.Data Science from Scratch Khóa học này cung cấp các tài liệu và mã nguồn cho Khoa học Dữ liệu từ cơ bản.
Liên kết: Data Science from Scratch Số lượng forks: 4.1k Số lượng stars: 22.5k Số người theo dõi: 22.5k
14.Coursera Data Science Tài liệu và bài tập từ khóa học Khoa học Dữ liệu trên Coursera.
Liên kết: Coursera Data Science with R Số lượng forks: 1.8k Số lượng stars: 1.1k Số người theo dõi: 1.1k
15.Data Science in Python Khóa học này cung cấp các tài liệu về Khoa học Dữ liệu sử dụng Python.
Liên kết: Data Science in Python Số lượng forks: 1.5k Số lượng stars: 5.6k Số người theo dõi: 5.6k
16. Machine Learning with Python Tài liệu và mã nguồn cho học máy với Python.
Liên kết: Machine Learning with Python Số lượng forks: 6.5k Số lượng stars: 25.4k Số người theo dõi: 25.4k
17.Stanford TensorFlow Tutorials Khóa học này cung cấp các ví dụ mã nguồn cho khóa học CS 20: TensorFlow for Deep Learning Research tại Đại học Stanford (Huyền Chip chia sẻ).
Liên kết: Stanford TensorFlow Tutorials Số lượng forks: 4.3k Số lượng stars: 10.3k Số người theo dõi: 622
18.Deep Learning Specialization on Coursera Đây là bộ bài tập và ghi chú từ khóa học Deep Learning Specialization trên Coursera, được cung cấp bởi deeplearning.ai.
Liên kết: Deep Learning Specialization on Coursera Số lượng forks: 2.3k Số lượng stars: 3.2k Số người theo dõi: 30
19.Practical RL: A course in reinforcement learning in the wild Khóa học này cung cấp tài liệu về học tăng cường (reinforcement learning) với các ví dụ thực tế.
Liên kết: Practical RL Số lượng forks: 1.9k Số lượng stars: 10.1k Số người theo dõi: 320
20.Creative Applications of Deep Learning with TensorFlow Khóa học này tập trung vào các ứng dụng sáng tạo của học sâu với TensorFlow.
Liên kết: Creative Applications of Deep Learning with TensorFlow Số lượng forks: 1.3k Số lượng stars: 6.1k Số người theo dõi: 184
Ngoài ra, Chương trình cấp bằng khoa học máy tính của OSSU cung cấp chương trình giáo dục toàn diện về các khái niệm khoa học máy tính cơ bản cho mọi ngành máy tính. Chương trình giảng dạy được thiết kế theo yêu cầu về bằng cấp của sinh viên chuyên ngành khoa học máy tính bậc đại học tại các trường đại học hàng đầu. Chương trình sử dụng các khóa học chất lượng cao từ các nền tảng như edX, Coursera và Udacity do các giáo sư từ các trường như MIT, Harvard và Princeton giảng dạy.
21.Computer Science Liên kết: Computer Science Số lượng forks: 21.9k Số lượng stars: 173k Số người theo dõi: 5821