03 vị trí dẫn đầu đang thuộc về các đội quốc tế có thành viên đến từ Argentina, Ấn Độ, Mỹ, Nga. Tuy nhiên, bảng xếp hạng này được tính toán dựa trên 10% dữ liệu thử nghiệm, kết quả chung cuộc sẽ dựa trên 90% dữ liệu còn lại. Do đó, cơ hội rinh về giải nhất 20,000 USD và giải thưởng 8,000 USD cho đội Việt Nam có thành tích xuất sắc vẫn đang tiếp tục rộng mở.
Với đề bài thực tế, yêu cầu xây dựng một mô hình tự động phát hiện tổn thương trên X-quang phổi, lời giải của các đội thi sẽ hỗ trợ các bác sĩ vốn rất bận rộn trong việc chẩn đoán bệnh, giảm tải cho các bệnh viện trong việc sàng lọc bệnh nhân, giúp tiết kiệm rất nhiều thời gian và nhân lực.
Trong gần 02 tháng kể từ khi khởi tranh, hàng trăm câu hỏi đã được đưa ra và nhận được những đóng góp sôi nổi từ cộng đồng quốc tế. Nội dung thảo luận xoay quanh việc xử lý bộ dữ liệu đa định dạng, phương pháp giải đề bài tích hợp nhận diện và phân loại điểm bất thường, lý giải phương thức đánh giá mAP@0.4…
“18.000 ảnh X-quang được chia sẻ là một trong những bộ dữ liệu X-quang chi tiết nhất từ trước tới nay, đặc biệt là có các vùng tổn thương được gán nhãn bởi 17 bác sĩ chẩn đoán hình ảnh kinh nghiệm thay vì các nhãn phân loại đơn thuần.” Kỹ sư AI Nguyễn Bá Dũng, một trong những Kaggle Master đến từ Phòng Xử lý ảnh Y tế của VinBigdata cho biết.
Với kinh nghiệm hơn 03 năm chinh chiến các cuộc thi trên nền tảng Kaggle, lọt top không dưới 10 cuộc thi và xuất sắc với phần trình diễn solo ẵm trọn Top 1 trị giá 8.000 USD tại cuộc thi Global Wheat Detection 2020, theo anh Dũng, để giải quyết những bài toán ảnh có tính chất đặc trưng như thế này, lộ trình của các đội nên sắp xếp thành 04 bước như sau:
- Bước 1: Xử lý dữ liệu: Dựa trên bộ dữ liệu đào tạo do BTC cung cấp (ví dụ với VinBigdata là 15.000 ảnh X-quang phổi có cung cấp kết quả gán nhãn), đội thi sẽ chia ra thành các tập dữ liệu con để xây dựng và đánh giá mô hình. Thông thường, tỉ lệ phân chia là 80% (training) và 20% (validation). Sau đó, thực hiện các phép biến đổi như xoay, lật, điều chỉnh độ sáng để làm tăng độ đa dạng của dữ liệu.
- Bước 2: Huấn luyện mô hình: Cần lựa chọn mô hình phù hợp nhất cho bài toán phát hiện đối tượng trong ảnh. Ví dụ, những mô hình được sử dụng phổ biến nhất hiện nay là YOLO (You Only Look Once), EfficientDet, FasterRCNN. Sau khi đã lựa chọn được các mô hình phù hợp, đội thi sẽ cho chạy đồng thời nhiều mô hình khác nhau để tiến hành việc huấn luyện.
- Bước 3: Kết hợp mô hình: Với cùng một câu hỏi, tham khảo nhiều ý kiến khác nhau sẽ cho ra câu trả lời chính xác và toàn diện nhất. Tương tự như vậy, khi giải bài toán Object Detection, để lấy được thông tin của các mô hình khác nhau, cần thực hiện các phép biến đổi tọa độ của bounding box (trung bình tọa độ, xóa bounding box giao nhau…). Đối với các đội thi, mỗi thành viên có thể xử lý các mô hình độc lập, sau đó sử dụng thuật toán gom vùng tổn thương để kết hợp các mô hình với nhau. Do đó, đội thi tham gia giải đề càng sớm và càng đông thành viên thì sẽ có càng nhiều lợi thế về số lượng mô hình cũng như thời gian xây dựng, kết hợp và thử nghiệm mô hình.
- Bước 4: Lọc nhiễu: Để tăng độ chính xác của mô hình, bước cuối cùng nhưng cũng không kém phần quan trọng là loại bỏ các dữ liệu nhiễu khỏi tập huấn luyện. Ở đây, các đội tiến hành kết hợp một số phương pháp lọc nhiễu, xử lý để dữ liệu sạch hơn.
Cuộc thi Phát hiện điểm bất thường trên ảnh X-quang lồng ngực được VinBigdata tổ chức trên nền tảng Kaggle với tổng giá trị giải thưởng 50,000 USD. Cuộc thi cung cấp bộ dữ liệu thuần Việt, bao gồm 15,000 ảnh X-quang lồng ngực để huấn luyện thuật toán và 3,000 hình ảnh sử dụng để đánh giá hiệu năng của thuật toán. Đội thi xuất sắc nhất sẽ giành được giải thưởng trị giá 20,000 USD. Ngoài ra, 8,000 USD sẽ được trao cho đội Việt Nam có thành tích ấn tượng.
Ngày 31/03/2021, cuộc thi sẽ chính thức khép lại. Chỉ còn hơn 01 tháng để các đội tranh tài tại cuộc thi Phát hiện điểm bất thường trên ảnh X-quang lồng ngực. Đừng bỏ lỡ cơ hội cạnh tranh, cọ xát cùng đội ngũ quốc tế.