● Xây dựng, khai thác Data warehouse, Data lake
● Xây dựng và vận hành hệ thống tính toán, xử lý dữ liệu phân tán trên nền tảng data lake
● Phối hợp bộ phận data Scientist Triển khai các thuật toán mining dữ liệu, classification, clustering, mô hình, xử lý đồ thị trên hệ thống phân tán.
● Xây dựng hệ thống job analytics dữ liệu, báo cáo trên nền tảng Spark, presto ...
● Quản trị dữ liệu trên hệ thống bigdata, xây dựng dự án, viết script, tool, tích hợp các hệ thống đồng bộ dữ liệu vào Data lake
(Thông tin dự án sẽ chi tiết trong buổi phỏng vấn)
Mô tả công việc
Quyền lợi được hưởng
1. Chế độ về lương thưởng, thu nhập
• Mức lương 20M - 40M, tùy level
• Có chế độ hỗ trợ tiền điện thoại và ăn trưa, nghỉ mát hàng năm; kèm theo là các khoản thưởng vào các dịp lễ lớn (30/4, 1/5, 2/9, ngày thành lập Tập đoàn, Tổng Công ty, Tết Dương/ Âm)
2. Chương trình chăm sóc sức khỏe
• Được đóng đầy đủ về các chế độ bảo hiểm xã hội, bảo hiểm y tế, bảo hiểm thất nghiệp và các gói bảo hiểm sức khỏe khác.
• Hàng năm CBNV được tham gia khám sức khỏe định kỳ tại các bệnh viện lớn.
• Phụ nữ có con nhỏ dưới 1 tuổi sẽ được nghỉ thêm 1h/ngày
3. Đào tạo, phát triển
• Hàng tuần, công ty tổ chức buổi Seminar trao đổi, chia sẻ về các công nghệ mới nhất; là cơ hội để các thành viên học hỏi lẫn nhau.
• Được tham gia các khóa học bổ ích từ các diễn giả Quốc tế tại Học viện Viettel
• Có cơ hội thăng tiến trong nghề nghiệp.
4. Hoạt động tập thể hấp dẫn, phong phú
• Tham gia vào hoạt động 'Happy Time" vào chiều thứ 6 hàng tuần cùng với chương trình sinh nhật tháng.
• Chương trình teambuilding, văn hóa, du lịch nghỉ mát hấp dẫn và đa dạng.
• Các hoạt động thể dục thể thao cùng các giải đấu được Tập đoàn tổ chức.
Yêu cầu công việc
● Tốt nghiệp Đại học các chuyên ngành CNTT, Khoa học máy tính,... Ưu tiên ứng viên tốt nghiệp các trường Bách Khoa, Học viện Bưu chính, ĐH Công nghệ-ĐH Quốc gia Hà Nội hoặc các trường ĐH quốc tế.
● Có ít nhất 2++ năm kinh nghiệm làm việc trở lên một trong các ngôn ngữ sau Python, Java, Scala. Ưu tiên sử dụng Java là 1 lợi thế
● Hiểu biết và sử dụng thành thạo SQL.
● Kinh nghiệm : Ít nhất 2 năm làm việc với các thư viện, hệ thống phân tán.
● Thành thạo & đã từng triển khai các hệ thống xử lý, job tính toán dữ liệu phân tán : Hadoop, Spark, Hive, Pentaho.
● Am hiểu và có kinh nghiệm làm việc với cơ sở dữ liệu phân tán Nosql & In memories database: Hbase hoặc Cassandra, MongoDB, Redis.
Ưu tiên các ứng viên :
● Có kinh nghiệm triển khai các mô hình thuật toán với dữ liệu lớn trên nền tảng hadoop, spark
● Kinh nghiệm triển khai bài toán về analytics trên dữ liệu lớn bằng spark