Khoa học dữ liệu – Kỹ năng và cơ hội nghề nghiệp (Data Science – Career options and skills),
Data Analyst, Data Engineer hay Data Scientist?
Chả là, gần đây có đứa cháu đỗ đại học ngành Hệ Thống Thông Tin (IS) và có ý muốn theo đuổi lĩnh vực Data Science. Nên mạn phép chia sẻ cái hiểu của mình về các chức danh này để giải thích cho cháu nó nắm. Các ACE và cao nhân cho thêm ý kiến nhé! Đại loại thế này.
Ngày nay, không tổ chức nào có thể tồn tại nếu không có các kế hoạch chiến lược và ra quyết định dựa trên dữ liệu. Vậy vai trò của các chuyên gia dữ liệu trên là gì và có đóng góp như thế nào trong tổ chức, doanh nghiệp?
1/ Data Analyst: Chuyên viên phân tích dữ liệu
✥ Vai trò: Process & Analyze for Insights – Phân tích dữ liệu và giúp đưa ra quyết định tối ưu (new perspectives from known data)
✥ Nhiệm vụ: Thu thập và làm sạch dữ liệu, thực hiện phân tích, báo cáo và trực quan hóa dữ liệu
2/ Data Engineer: Kỹ sư dữ liệu
✥ Vai trò: Đảm bảo chất lượng dữ liệu, phát triển và đảm bảo vận hành hệ thống dữ liệu (là cầu nối quan trọng giữa Data Scientist và Data Analyst)
✥ Nhiệm vụ: Design & Optimize Big data – Xây dựng và tối ưu hóa hệ thống bằng các công cụ kỹ thuật phức tạp (coding) để xử lý dữ liệu quy mô lớn (cho phép Data Scientist và Data Analyst tập trung vào phân tích và giải quyết vấn đề)
3/ Data Scientist: Nhà khoa học dữ liệu (VIP)
✥ Vai trò: Phân tích và giải thích dữ liệu phức tạp (tiếp nhận dữ dữ liệu từ Data Engineer và Data Analyst, tổ chức, sắp xếp dữ liệu lớn để xây dựng mô hình để đưa ra Insight – Cái nhìn sâu sắc về dữ liệu). Goal & Predict- Đạt được mục tiêu thông qua dữ liệu. (discover unknown from known data)
✥ Nhiệm vụ: Áp dụng kiến thức chuyên gia (domain knowledge) liên quan đến thống kê và xây dựng các mô hình học máy (machine learning) để dự đoán và trả lời một số câu hỏi mang tính quyết định trong kinh doanh. (strong foundation in modeling, analytics, math, statistics, and computer science)
4/ Business Intelligence Analyst (BI/BA): Kinh doanh thông minh
✥ Vai trò: Phân tích kinh doanh và nâng cao dịch vụ khách hàng
✥ Nhiệm vụ: Phân tích dữ liệu, nắm vững các công cụ và kỹ thuật xử lý dữ liệu, cầu nối giữa khách hàng và doanh nghiệp cố vấn/quân sư cho chủ doanh nghiệp về hiệu quả (đánh giá, đề xuất – KPI).
Data Analyst và Data Scientist khác nhau ra sao?
✥ Data Scientist vẫn cần khả năng như một Data Analyst. Tuy nhiên họ có chuyên môn sâu hơn về các kỹ năng này, đồng thời cũng có thể đào tạo và tối ưu hóa các mô hình học máy
✥ Data Analyst tập trung vào việc hiểu dữ liệu trong quá khứ và hiện tại, thì Data Scientist tập trung vào việc đưa ra các dự đoán đáng tin cậy cho tương lai bằng những kiến thức về các thuật toán và thống kê nâng cao
Chúng ta cùng tìm hiểu chi tiết hơn nhiệm vụ và vai trò của một Data Scientist cũng như các kỹ năng cần thiết cho vị trí này nhé.
Data Scientist, họ là ai?
Data Scientist – Nhà khoa học dữ liệu là một chuyên gia trong lĩnh vực phân tích dữ liệu có kỹ năng về kỹ thuật (technical skills) và khả năng khám phá và giải quyết các vấn đề phức tạp thông qua dữ liệu.
Nhiệm vụ của một Data Scientist là gì?
– Thu thập và xử lý một lượng lớn dữ liệu thô và biến nó thành dữ liệu hữu ích hơn (data insight).
– Giải quyết các vấn đề liên quan đến kinh doanh bằng các kỹ thuật hướng dữ liệu (data-driven).
– Có thể sử dụng nhiều ngôn ngữ lập trình bao gồm 𝐏𝐲𝐭𝐡𝐨𝐧, R, SAS
– Có kiến thức vững chắc về 𝐓𝐡𝐨̂́𝐧𝐠 𝐤𝐞̂, bao gồm kiểm tra và phân bố thống kê.
– Nắm vững các kỹ thuật phân tích dữ liệu bằng 𝐌𝐚́𝐲 𝐡𝐨̣𝐜, 𝐇𝐨̣𝐜 𝐬𝐚̂𝐮
và phân tích văn bản.
– Giao tiếp và làm việc liên quan đến Công nghệ thông tin và Kinh doanh.
– Tìm kiếm thứ tự và các mẫu trong dữ liệu, xu hướng nổi bật và đưa ra các giải pháp giúp tăng lợi nhuận của doanh nghiệp.
Các kỹ năng cần có của một Data Scientist?
– Khai thác dữ liệu (data mining): là quá trình khai thác và chuyển đổi dữ liệu thô (raw data) thành các dạng dữ liệu có giá trị sử dụng cho việc phân tích
– Trực quan hóa dữ liệu (data visualization): trình bày dữ liệu dưới dạng biểu đồ, hình ảnh nhằm thuận lợi cho quá trình phân tích dữ liệu
– Máy học (machine learning): sử dụng các thuật toán và công cụ tự động hóa để xử khối lượng dữ liệu lớn
– Học sâu (deep learning): xây dựng các mô hình phân tích và xử lý dữ liệu phức tạp và trừu tượng
– Xác định mẫu dữ liệu (pattern recognition): sử dụng các công cụ kỹ thuật (thường là Máy học) để nhận diện các mẫu dữ liệu
– Phân tích văn bản (text analytics): khai thác các dữ liệu phi cấu trúc nhằm trích lọc những thông tin giá trị (insight)
– Và một số kỹ năng data khác: Python, SQL, Hadoop, Business Understanding & Strategies
Những lĩnh vực cần đến Data Scientist là gì?
Kinh doanh, thương mại: Phân tích khách hàng, thu thập và phân tích dữ liệu khách hàng để hiểu rõ hơn về hành vi của khách hàng giúp thực hiện các quyết định kinh doanh liên quan đến tiếp thị, phát triển sản phẩm, bán hàng, dự đoán giá và phát hiện các nguy cơ khách hàng rời bỏ dịch vụ để có chính sách chăm sóc phù hợp…
Tài chính, ngân hàng: Phân tích gian lận là việc sử dụng các kỹ thuật phân tích dữ liệu lớn để phát hiện các rủi ro, bất thường và ngăn chặn gian lận tài chính trực tuyến. Nó có thể giúp các tổ chức tài chính dự đoán hành vi gian lận trong tương lai một cách nhanh chóng và giúp tiết kiệm thời gian giao dịch, nâng cao trải nghiệm khách hàng. Bao gồm ngân hàng, công ty đầu tư, công ty bảo hiểm và lĩnh vực bất động sản.
Thị trường chứng khoán: Phân tích chứng khoán cho phép các nhà đầu tư xác định giá trị nội tại của một chứng khoán trước khi đầu tư vào nó. Tất cả các kỹ thuật về thị trường chứng khoán đều nghiên cứu kỹ lưỡng bởi các chuyên gia nhằm cố gắng dự đoán được xu hướng trong tương lai.
Lĩnh vực công nghệ: Bao gồm bất kỳ nhà cung cấp dịch vụ và nhà sản xuất ứng dụng, nền tảng kỹ thuật số nào sử dụng dữ liệu làm động lực chính để phát triển sản phẩm. Việc sử dụng dữ liệu lớn và các thuật toán máy học để cải thiện trải nghiệm người dùng, đồng thời thu thập thêm dữ liệu người dùng mới.
Các lĩnh vực nghiệp vụ khác: Sử dụng khoa học dữ liệu để giúp các doanh nghiệp tối ưu hóa hoạt động của họ. Các nhà khoa học dữ liệu làm việc trong ngành dịch vụ chuyên nghiệp hỗ trợ khách hàng trong việc thu thập, quản lý và phân tích dữ liệu.
Hiểu rõ được vai trò, nhiệm vụ của một Data Analyst, Data Engineer, Data Scientist, hy vọng bạn có thể xác định cho mình lộ trình để trang bị những kỹ năng cần thiết nhé.