Thế kỷ XXI chứng kiến cuộc cách mạng 4.0 của Internet, khoa học công nghệ và trí tuệ nhân tạo. Những thành tựu của cuộc cách mạng này đã và đang khiến cuộc sống của chúng ta thay đổi vượt bậc. Giờ đây, chỉ cần một “cú chạm” trên màn hình điện thoại, bạn có thể điều hành cả một hệ thống. Hoặc điển hình như việc mua sắm chuyển từ trạng thái “offline” – ra tận cửa hàng sang hình thức online của các trang thương mại điện tử, các website…
Trong cuộc cách mạng 4.0, Big Data được xem là “nguồn dầu mỏ” khổng lồ để vận hành hệ thống máy móc trong thế kỷ XXI. Đây là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp khác với cách truyền thống. Dữ liệu này bao gồm thu thập, giám sát, tìm kiếm, dự báo, phân tích hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác trích xuất giá trị từ dữ liệu khác. Nó là một phần của lĩnh vực Kỹ thuật số, cùng với vạn vật kết nối Internet (IoT), trí tuệ nhân tạo (AI).
Tại Việt Nam, các công ty/ doanh nghiệp công nghệ, các “kỳ lân” công nghệ lớn đều đang chú trọng phát triển lĩnh vực big data, vì đây là cách mà các doanh nghiệp tạo ra lợi thế cạnh tranh cho doanh nghiệp bằng cách thu thập dữ liệu, đánh giá hành vi khách hàng và đề xuất các sản phẩm tương tự. Ví dụ, các ứng dụng đặt xe phải luôn cập nhật dữ liệu về bản đồ (Maps) để tối ưu cho người dùng chọn điểm đón dễ dàng, các sàn thương mại điện tử cần xử lý dữ liệu về hành vi của người dùng khi sử dụng ứng dụng mua sắm của mình…
Từ đó, big data giúp các công ty công nghệ kiểm tra và quản lý tất cả dữ liệu khách hàng để nâng cao trải nghiệm của họ và đưa ra phương hướng giữ khách hàng cho mình. Phân tích các hoạt động của doanh nghiệp, công ty giúp cải thiện hiệu suất làm việc và vận hành có tổ chức hơn, hiệu quả hơn. Bên cạnh đó còn tối ưu hóa giá cả, tăng doanh thu, giảm thiểu rủi ro…
Hơn nữa, khoa học dữ liệu là một ngành rất mới ở nước ta, nhưng giàu triển vọng khi Chính phủ quyết tâm phát triển nền kinh tế số và đặt ra mục tiêu đến năm 2025, kinh tế số sẽ đóng góp 20% vào GDP của cả nước. Ở giai đoạn “ươm mầm” những thế hệ kỹ sư khoa học dữ liệu đầu tiên của đất nước, hầu hết các doanh nghiệp đều đang “nhập khẩu” lao động về khoa học dữ liệu từ nước ngoài như Ấn Độ, Anh, Mỹ… với giá cả đắt đỏ. Người làm được loại việc này liên tục được mời gọi bởi các tổ chức “săn đầu người”, nhưng vẫn thiếu hụt nhân sự trầm trọng. Do đó, ngành học khoa học dữ liệu hứa hẹn nhiều cơ hội cho các học sinh, sinh viên trong tương lai để “cạnh tranh” với các nguồn lực từ bên ngoài.
Về mức lương, tại Thung lũng Silicon, thu nhập của các nhà khoa học dữ liệu cấp đầu vào đã là 6 con số (USD); tại Trung Quốc, lấy kỹ sư phát triển Hadoop làm ví dụ, mức lương hàng năm của các kỹ sư tại Hadoop có 2-3 năm kinh nghiệm làm việc có thể lên tới 300.000 – 500.000 USD. Riêng khảo sát từ Việt Nam, mức lương trung bình được khảo sát dựa trên 295 việc làm của các trang web tuyển dụng cho vị trí Data Scientist (kỹ sư khoa học dữ liệu) là 1.330 USD/tháng (khoảng gần 30 triệu đồng) cho người chưa có kinh nghiệm và tăng dần theo cấp bậc vị trí.
Đặc biệt, các lĩnh vực mà nhân viên dữ liệu lớn có thể phát huy thế mạnh của họ rất rộng, từ các công ty khởi nghiệp Internet đến các tổ chức tài chính, các dự án dữ liệu lớn đều cần thiết ở khắp mọi nơi để thúc đẩy sự đổi mới. Sinh viên học khoa học dữ liệu có thể đảm nhiệm 1 trong 3 nhánh chính của ngành này tại các doanh nghiệp: Tạo và quản trị dữ liệu, phân tích dữ liệu, và áp dụng kết quả phân tích thành những hành động có giá trị. Các vị trí tiêu biểu như: Nhà Khoa học dữ liệu (Data Scientist), nhà phân tích dữ liệu (Data Analyst), kỹ sư học máy (Machine Learning Engineer), kỹ sư dữ liệu (Data Engineer), nhà phát triển Business Intelligence (BI).
Hiện tại ở Việt Nam, các trường đại học khoa học công nghệ đều có ngành học này để bắt kịp xu thế với điểm chuẩn cao “ngất ngưởng”. Năm 2022, trường đại học Khoa học Tự nhiên tuyển ngành Khoa học dữ liệu (Mã ngành: 7460108), Tổ hợp xét tuyển: A00 A01 B08 D07 với điểm chuẩn là 26,70, trong đó đi kèm điều kiện điểm đánh giá năng lực của Đại học Quốc gia là 912 điểm. Các trường khác như đại học Công nghệ FPT, đại học Công nghệ Tp. Hồ Chí Minh (Hutech)… đều tuyển sinh khối ngành này.
Các nhóm kỹ năng cần thiết của một nhà khoa học dữ liệu bao gồm Phân tích (Analytics), Lập trình (Programming), và Kiến thức chuyên ngành (Domain Knowledge). Chính vì thế, nếu bạn theo học ngành Khoa học dữ liệu, bạn sẽ được học một số các môn chuyên ngành liên quan. Theo học ngành Khoa học dữ liệu, bạn cần biết cách đưa ra những đánh giá công bằng và hiệu quả thông qua phân tích, đặt câu hỏi và đánh giá khách quan trước vấn đề.