Skip to main content

Tìm hiểu về Apache Spark UCBerkeleyX

GIỚI THIỆU CHUNG

Spark hiện nay đang nhanh chóng trở thành lựa chọn chính cho phương pháp tính toán của big data. Các chương trình Spark ngắn gọn hơn và thường chạy nhanh hơn 10-100 lần so với Hadoop MapReduce. Vì các công ty nhận ra điều này nên các nhà phát triển Spark đang trở nên ngày càng có giá trị.

Khóa học thống kê và phân tích dữ liệu này sẽ dạy cho bạn những điều cơ bản khi làm việc với Spark và sẽ cung cấp cho bạn những nền tảng cần thiết cho việc tìm hiểu sâu hơn về Spark. Bạn sẽ tìm hiểu về cấu trúc và mô hình lập trình Spark, bao gồm cả các API thường được sử dụng. Sau khi hoàn thành khóa học, bạn sẽ có thể viết và debug các ứng dụng Spark cơ bản. Khóa học này cũng sẽ giải thích làm thế nào để sử dụng giao diện web cho người dùng của Spark (UI), làm thế nào để nhận ra các lỗi coding thông thường, và làm thế nào để chủ động ngăn chặn các lỗi. Trọng tâm của khóa học sẽ là Spark Core và Spark SQL.

KIẾN THỨC NỀN TẢNG CẦN THIẾT

Khóa học này bao gồm các kiến thức cấp đại học ở mức độ cao cấp. Nó đòi hỏi một nền tảng và kinh nghiệm lập trình với Python (hoặc khả năng để tìm hiểu nó một cách nhanh chóng). Tất cả các bài tập sẽ sử dụng PySpark (API Python cho Spark), nhưng kinh nghiệm trước đó với Spark hoặc tính toán phân tán là KHÔNG cần thiết. Nếu bạn chưa nắm được các kiến thức lập trình với Python, mời bạn tham gia các khóa học về Python có sẵn trên Kiến học bao gồm Python căn bản TẠI ĐÂY và Python nâng cao TẠI ĐÂY.

GIẢNG VIÊN

Anthony D. Joseph

Anthony D. Joseph

Anthony D. Joseph là Giáo sư ngành Kỹ nghệ điện và Khoa học máy tính tại Đại học UC Berkeley. Ông nhận bằng Kỹ sư, Thạc sĩ và Tiến sĩ về Khoa học máy tính của MIT. Ở trường UC Berkeley, ông đang phát triển các kỹ thuật cho: điện toán đám mây, mạng và bảo mật máy tính, và bảo vệ an ninh cho các hệ thống ra quyết định dựa trên machine-learning. Ông cũng là người đồng dẫn đầu thử nghiệm DETERlab, một thử nghiệm khả năng mở rộng bảo mật để tiến hành nghiên cứu an ninh mạng, và ông là Cố vấn kỹ thuật tại Databricks.

Câu hỏi thường gặp

Khoá học này có miễn phí không?

Có. Cùng với nhiều khoá học khác, đây là đóng góp của đội ngũ Kiến Học (bao gồm cả các cố vấn, các tình nguyện viên, và đội ngũ kỹ thuật) cho cộng đồng. Hãy ghé thăm Website Kiến Học để tìm hiểu về những lợi ích mà Kiến Học mang lại. Đồng thời, hãy like Facebook Kiến Học để nhận thông tin về các khoá học mới và các tin tức khoa học thú vị.

Khoá học này bằng tiếng Việt?

Toàn bộ các khóa học tại Kiến Học đều được dịch ra và phụ đề bằng tiếng Việt, trong đó có nhiều khóa có thêm lựa chọn phụ đề tiếng Anh qua đó giúp các bạn có thể cùng lúc học thêm tiếng Anh. Khóa học này là khóa được cung cấp bài giảng song ngữ.

Khi có thắc mắc về nội dung khoá học, tôi có thể hỏi ai?

Kiến Học luôn sẵn sàng lắng nghe và giúp đỡ. Khi có bất kỳ thắc mắc gì, bạn đừng ngại đặt câu hỏi với cố vấn của khoá học và các bạn học khác, thông qua Diễn đàn thảo luận Kiến Học

Ghi chú về bản quyền

Các videos của khóa học này thuộc bản quyền của Đại học UC Berkeley và được cho phép sử dụng thông qua hình thức nhúng video từ Youtube. Vui lòng xem giải thích rõ hơn tại ĐÂY.

Enroll