VPI phát triển sản phẩm dữ liệu

Ngày 27/2/2023, Viện Dầu khí Việt Nam (VPI) đã trao tặng phần thưởng cho 5 giải Nhất trong chương trình đào tạo với chủ đề “Thanh niên VPI tiên phong trong sáng tạo sản phẩm dữ liệu”.

VPI đã trao tặng 5 máy tính Macbook Air M1 tại vị trí làm việc cho 5 đoàn viên có sản phẩm dữ liệu đạt giải Nhất trong chương trình đào tạo của VPI với chủ đề “Thanh niên VPI tiên phong trong sáng tạo sản phẩm dữ liệu”. Chương trình đào tạo kéo dài hơn 2 tháng đã cung cấp kiến thức về xu hướng phát triển của thị trường phân tích dữ liệu, các nguồn và cấu trúc dữ liệu, các phương pháp và kỹ thuật phân tích dữ liệu; từ đó ứng dụng vào các công việc đang triển khai, góp phần nâng cao năng lực chuyên môn và lan tỏa nét văn hóa “Tự học hỏi, tự hoàn thiện bản thân”.

Đại diện Ban tổ chức chương trình đào tạo trao phần thưởng 3 đoàn viên đạt giải Nhất tại khu vực Hà Nội gồm Trần Xuân Quý, Nguyễn Thị Thanh, Trần Đăng Tú (từ trái sang phải) 

Đại diện Ban tổ chức chương trình đào tạo trao phần thưởng cho 2 đoàn viên đạt giải Nhất tại tp. Hồ Chí Minh gồm Trương Văn Nhân, Nguyễn Thị Thanh Ngà (từ trái sang phải) 

Các ý tưởng, sản phẩm dữ liệu đạt giải là các phương án, giải pháp sáng tạo hỗ trợ giải quyết những tồn tại, khó khăn trong công việc chuyên môn của các đoàn viên được xây dựng thông qua chương trình đào tạo cùng với sự hướng dẫn, hỗ trợ và góp ý của các chuyên gia VPI (TS. Phan Ngọc Trung, TS. Nguyễn Hồng Minh, TS. Nguyễn Hữu Lương, ThS. Nguyễn Phương Thủy), Bộ phận Phân tích dữ liệu và Bộ phận Nắm thị trường của VPI. Được chọn lọc từ 11 sản phẩm có chất lượng tốt nhất trong chương trình đào tạo, 5 sản phẩm đại giải Nhất sẽ được VPI đầu tư phát triển trong thời gian tới. Cụ thể:

  1. Ứng dụng ngôn ngữ lập trình Python để hiệu chỉnh (normalization) đường Gamma ray (GR) trong địa vật lý giếng khoan (đoàn viên Nguyễn Thị Thanh)

Hiệu chỉnh (normalization) đường gamma ray (GR) trong địa vật lý giếng khoan là rất cần thiết khi có sự khác biệt về dải giá trị hoặc scale của các đường GR do sai số về mặt kỹ thuật của thiết bị đo, sự khác nhau về quá trình hiệu chỉnh ảnh hưởng môi trường giếng lên giá trị đo, đường GR được đo bằng những tool khác nhau, thiết bị của nhiều công ty khác nhau, hoặc các loại thiết bị thay đổi theo thời gian… Tác giả đã ứng dụng ngôn ngữ lập trình Python để tạo công cụ hiệu chỉnh tự động đường GR, áp dụng thử nghiệm cho 9 giếng khoan trong khu vực mỏ Sư Tử Đen, Lô 15-1, bể Cửu Long. Công cụ này giúp cho người minh giải tiết kiệm thời gian khi có thể tiến hành cho nhiều giếng khoan cùng một lúc, thuận tiện hơn trong việc kiểm tra dữ liệu, phát hiện các giá trị dị thường, có thể làm việc linh hoạt hơn trên các nền tảng web mà không cần đến các phần mềm chuyên ngành. Bên cạnh đó, sản phẩm cũng dễ dàng tích hợp thành tool đi kèm hoặc thành các bước chuẩn bị tài liệu cho những công việc với các nền tảng khác. Trong thời gian tới, tác giả sẽ tiếp tục hoàn thiện thêm các tính năng khác của sản phẩm, kết hợp sản phẩm với các nghiên cứu chuyên sâu khác ví dụ log conditioning, chuẩn hóa dữ liệu cho liên kết giếng khoan tự động, minh giải tự động bằng AI/ML…

  1.  Xây dựng công cụ dự báo sản lượng khai thác dầu sử dụng các thuật toán học sâu dựa trên cơ chế chú ý cho đối tượng móng nứt nẻ vòm Trung tâm, mỏ Bạch Hổ (đoàn viên Trần Đăng Tú)

Đối tượng móng có đặc điểm địa chất phức tạp, do đó, người điều hành mỏ đã thực hiện nhiều các phương pháp nhằm duy trì sản lượng khai thác như bơm ép nước, các giải pháp địa kĩ thuật, khoan đan dày… với sự hỗ trợ từ các công cụ truyền thống như: mô phỏng số và phân tích đường cong suy giảm. Tuy nhiên, hiệu quả dự báo khai thác từ các phương pháp này vẫn tồn tại nhiều hạn chế và độ tin cậy chưa cao. Để khắc phục các nhược điểm này, tác giả đã xây dựng công cụ dự báo sử dụng các thuật toán học sâu dựa trên cơ chế chú ý. Kết quả ban đầu khi sử dụng 1 thuật toán dựa trên cơ chế chú ý cho sai số ~10,7%, dự báo sản lượng khai thác dầu dựa trên dữ liệu khai thác trong quá khứ với độ chính xác đạt trên 70%. Việc ứng dụng cơ chế chú ý để đánh trọng số của các dữ liệu đầu vào trước khi đưa vào mô hình học sâu để huấn luyện có thể giúp nâng cao khả năng dự báo và tác giá kì vọng khi thử nghiệm, tối ưu các thuật toán dựa trên cơ chế chú ý có thể cho sai số < 8%.

  1. Chỉ số hydrogen Việt Nam (VN’s Hydrogen Index) (đoàn viên Trương Văn Nhân )

Chỉ số hydrogen Việt Nam (Hydrogen Index) là chỉ số thể hiện khả năng thâm nhập thị trường hydrogen sạch ở Việt Nam. Chỉ số càng lớn thể hiện khả năng thâm nhập thị trường và mức độ phát triển của lĩnh vực hydrogen càng lớn. Đồng thời, cũng thể hiện so sánh khả năng thâm nhập giữa 2 loại hydrogen sạch (Blue và Green hydrogen) để thấy được loại nào được đánh giá tốt hơn tại thời điểm lựa chọn. Thông tin sản phẩm mang lại không chỉ liên quan đến chỉ số hydrogen Việt Nam mà còn một số thông tin cơ bản khác như về thị trường, các dự án hydrogen Việt Nam, LCOH… Sản phẩm này có thể sử dụng cho nhiều khách hàng khác nhau như để tư vấn cho khách hang, nắm bắt được tình hình phát triển lĩnh vực hydrogen sạch ở Việt Nam và hỗ trợ đưa ra quyết định đầu tư lựa chọn đúng loại hydrogen sạch

  1. Tối ưu hóa (trực quan dữ liệu) dữ liệu hiện có tại phòng thí nghiệm; dự đoán xu hướng các thông số thể hiện độ giàu vật chất hữu cơ và mức độ trưởng thành nhiệt (TOC, S2, Tmax, Ro) cho các độ sâu mong muốn (đoàn viên Nguyễn Thị Thanh Ngà)

Giải pháp này hỗ trợ cho lĩnh vực thăm dò trong công tác tự động đọc và phân tích dữ liệu đầu vào; xử lý tự động dữ liệu thô (độ sâu và địa tầng; kết quả phân tích thạch học và các chỉ tiêu địa hóa); dự báo xu hướng các thông số thể hiện độ giàu vật chất hữu cơ và mức độ trưởng thành nhiệt; biểu diễn dữ liệu bằng biểu đồ và hình ảnh mô phỏng thể hiện các thông số cho giếng khoan. Sau khi được xử lý sơ bộ bằng excel, dữ liệu sẽ được xử lý chuyên sâu bằng Python– Jupyter note bằng các thư viện Pandas, Numpy cho việc nạp và xử lý dữ liệu; Pandas_profiling để phân tích khám phá dữ liệu (EDA- Exploratory Data Analysis); Matplotlib, Seaborn nhằm trực quan hóa dữ liệu; xây dựng mô hình dự đoán bằng phương pháp xây dựng mô hình machine learning bằng Scikit-learn, Tensorflow để dự báo kết quả cho khu vực không lấy mẫu phân tích hoặc mẫu bị nhiễm bẩn nặng. Việc phân tích mẫu tại phòng thí nghiệm kết hợp việc sử dụng mô hình dự đoán để tăng tính chính xác và độ tin cậy trong dự đoán kết quả phân tích mẫu giếng khoan. Sản phẩm hiện đang được nghiên cứu cải thiện chức năng tự động hoá quá trình chọn lọc dữ liệu đầu vào và tối ưu hoá mô hình machine learning tăng độ tin cậy và giá trị sử dụng của mô hình.

  1. Bản đồ hóa các điểm dữ liệu (đoàn viên Trần Xuân Quý)

Hiện nay, công tác phân tích, đánh giá động thái khai thác mỏ chủ yếu sử dụng bảng biểu và dạng hình vẽ đơn giản cho từng giếng khoan, do đó, việc xác định phân bố, xu hướng động thái khu vực gặp khó khăn. Sản phẩm này đã xây dựng được các bản đồ như bản đồ ngập nước (bản đồ độ bão hòa nước); bản đồ lưu lượng khai thác (dạng bọt). Trong thời gian tới, sản phẩm sẽ được bổ sung thêm các thông tin (lưu lượng nước, lưu lượng dầu), tích hợp bản đồ địa chất (fault, contour) để dễ theo dõi và quản lý cũng như nâng cao trải nghiệm người dùng với khả năng thao tác trực tiếp trên bản đồ. Bên cạnh đó, vị trí giếng khoan cũng sẽ tương ứng với vị trí bắt gặp tầng sản phẩm.