Thử thách phân loại thảo mộc được đánh giá là một bài toán khó trong số nhiều cuộc thi ở hội thảo CVPR năm nay. Đội thi đến từ phòng Xử lý Ảnh Y tế gồm 3 kỹ sư Nguyễn Thành Nhân, Trần Quang Đạt và Ngô Thành Đạt đã xây dựng thành công mô hình có khả năng phân loại hơn 32000 loài thảo mộc khác nhau với bộ dữ liệu có trên 1 triệu ảnh trong vòng 2 tháng. Chung cuộc, hệ thống của ba chàng trai trẻ đã đạt được độ chính xác 84.5%, thành tích này một lần nữa khẳng định khả năng làm chủ công nghệ lõi, đạt chuẩn thế giới của VinBDI nói riêng và thế hệ khoa học tương lai của Việt Nam nói chung.
Chia sẻ về lý do lựa chọn bài toán phân loại thảo mộc – một bài toán tưởng chừng như không liên quan đến lĩnh vực nghiên cứu xử lý ảnh y tế mà đội đang làm, Nhân – trưởng nhóm chia sẻ: “Bài toán phân loại thảo mộc là một bài toán thú vị, rất khó để có thể phân loại và tìm ra đặc trưng của từng loại thảo mộc khác nhau. Với lượng dữ liệu lớn mà BTC cung cấp, đây là dịp để bọn mình đào tạo, từ đó đưa ra mô hình tốt nhất, đồng thời cũng là cơ hội để thuật toán của đội cọ xát với các đội trên toàn thế giới. Thành tích mà team đạt được cũng là một minh chứng về năng lực công nghệ của thuật toán lõi mà phòng xử lý ảnh y tế đang nghiên cứu và phát triển.”
Thuật toán mà đội sử dụng gồm 5 mạng tích chập (EfficientNet B3/B4/B5, Inception và ResNet) với nhiều cải tiến để phù hợp với bài toán phân loại mịn (fine-grained visual categorization). Những kinh nghiệm đúc kết được từ cuộc thi sẽ rất hữu ích trong việc giải quyết vấn đề mở rộng chuẩn đoán chi tiết các vùng tổn thương và bệnh lý. Ví dụ như vôi hóa trên ảnh X-quang vú có thể được chia thành vi vôi hóa nghi ngờ, vi vôi hóa điển hình, vi vôi hóa tuyến vú, vi vôi hóa da. Việc chuẩn đoán chi tiết tổn thương sẽ cung cấp nhiều thông tin chính xác và hỗ trợ tốt hơn cho bác sĩ chuẩn đoán hình ảnh. Chi tiết kĩ thuật về mô hình có thể được đọc thêm tại link. Đội dự kiến sẽ công bố mã nguồn mở và mô hình thuật toán ra cộng đồng trong thời gian tới.
Ngoài giải thưởng mới nhất tại Hội thảo CVPR năm nay, phòng Xử lý ảnh y tế đã nhiều lần xếp hạng cao tại 05 cuộc thi chẩn đoán ảnh y tế tầm cỡ thế giới trong năm 2019 và 2020, bao gồm:
- Đứng số 01 cuộc thi CheXpert chẩn đoán 12 mặt bệnh trên X-quang phổi do ĐH Stanford tổ chức (cuộc thi có quy mô lớn nhất trên thế giới về số lượng ảnh X-quang);
- Giải nhất cuộc thi phát hiện tổn thương trên ảnh nội soi do hội thảo ISBI 2020 (hội thảo hàng đầu thế giới về ảnh y tế) tổ chức;
- Đứng số 01 (giai đoạn 1) trên 1400 đội cuộc thi phân mảng tràn khí màng phổi do Hiệp hội ảnh y tế Hoa Kỳ (SIIM) tổ chức.
- Một trong 10 đội có thành tích cao nhất trên 1345 đội tại cuộc thi chẩn đoán chảy máu não trên ảnh CT do RSNA (Hiệp hội điện quang Bắc Mỹ – Hiệp hội chuyên môn lớn nhất về ảnh y tế trên thế giới với 54000 chuyên gia/bác sĩ tới từ 136 nước toàn cầu) tổ chức;
Dựa trên những thuật toán này, phòng xử lý ảnh y tế đang dần hoàn thiện và cho ra mắt VinDr – Giải pháp AI toàn diện cho chẩn đoán ảnh y tế, hỗ trợ các bác sĩ chẩn đoán hình ảnh đưa ra quyết định nhanh chóng và chính xác, tăng cường khả năng phát hiện và tránh bỏ sót những điểm thương tổn. Tập trung vào nhóm bệnh lý có nhu cầu khám chữa bệnh cao tại Việt Nam, giải pháp VinDr đang phát triển 06 tính năng: X-quang các bệnh về phổi; X-quang ung thư vú; CT ung thư phổi; CT ung thư gan; CT đột quỵ não; Cộng hưởng từ u não.
Phiên bản đầu tiên của giải pháp sẽ tập trung vào hai nhóm bệnh: X-quang các bệnh về phổi và các bệnh X-quang ung thư vú. Đề xuất bắt đầu triển khai thử nghiệm từ 15/06/2020 tại 3 bệnh viện: Bệnh viện Quân đội 108 và Bệnh viện Đại học Y Hà Nội và Bệnh viện Vinmec Times City.
CVPR (Computer Vision and Pattern Recognition) là hội nghị về Thị giác máy tính và Nhận dạng mẫu thường niên, được tổ chức lần đầu tiên tại Washington DC năm 1983. Hội nghị do IEEE Computer Society (Cộng đồng các chuyên gia trực thuộc Tổ chức kỹ sư điện, điện tử Hoa Kỳ) và CVF – The Computer Vision Foundation (Tổ chức về Thị giác máy tính) đồng tổ chức, hiện được xếp hạng là hội nghị số 1 thế giới về thị giác máy tính và nhận dạng mẫu.