Dưới sự dẫn dắt của các chuyên gia Trung tâm Xử lý ảnh y tế, Viện Nghiên cứu Dữ liệu lớn VinBigdata, Trần Tiến Thành và Đỗ Văn Dũng (học viên chương trình Đào tạo Kỹ sư AI Vingroup) đã có những bước trưởng thành đầu tiên với hai nghiên cứu khoa học về ứng dụng Thị giác máy tính trong chẩn đoán hình ảnh y tế. Tới đây, các bài báo sẽ được công bố tại hội thảo ICCV 2021 – chuyên đề về chẩn đoán hình ảnh y tế (Computer Vision for Automated Medical Diagnosis) – ICCV được biết tới là hội thảo lớn thứ 3 thế giới trong lĩnh vực Thị giác máy tính (theo Google Scholar).
Kết thúc quá trình đào tạo kiến thức nền tảng tại Chương trình Đào tạo Kỹ sư AI Vingroup, tháng 2/2021, Trần Tiến Thành và Đỗ Văn Dũng – 02 học viên Khóa 1 của Chương trình quyết định lựa chọn thực tập tại Trung tâm Xử lý ảnh y tế, VinBigdata. Chỉ sau đó nửa năm, nhờ sự hướng dẫn của đội ngũ khoa học giàu kinh nghiệm, Thành và Dũng đã có những thành công bước đầu, lần lượt tham gia vào các nghiên cứu về Chẩn đoán các bệnh lý thường gặp trên ảnh X-quang lồng ngực ở bệnh nhân nhi và Hệ thống tự động phân loại hình ảnh X-quang theo chỉ định chụp. Tháng 10 tới đây, hai công trình này sẽ góp mặt tại Hội thảo Quốc tế về Thị giác máy tính (IEEE International Conference on Computer Vision – ICCV 2021) chuyên đề về chẩn đoán hình ảnh y tế (Computer Vision for Automated Medical Diagnosis) – ICCV là hội thảo lớn thứ 03 thế giới trong lĩnh vực này (theo Google Scholar).
Đối với Tiến Thành, nghiên cứu lần này đánh dấu sự thay đổi đáng kể trong cách tiếp cận một bài toán về Trí tuệ nhân tạo (AI). “Tại VinBigdata, mình được tham gia giải quyết những vấn đề thực của y tế Việt Nam. Không còn là những bộ dữ liệu có sẵn, mà giờ đây là làm việc trên chính những bộ dữ liệu thô thu về từ các bệnh viện, sau đó tự tiến hành tinh chỉnh, định nghĩa bài toán, xây dựng và thử nghiệm mô hình học sâu – sau cùng, mình đã tiến bộ rất nhiều trong quá trình làm về AI.”
Kết quả của những nỗ lực đó, sau gần hai tháng thử nghiệm và hoàn thiện nghiên cứu dưới sự dẫn dắt của TS. Nguyễn Quý Hà (Giám đốc TT Xử lý ảnh y tế) và TS. Phạm Huy Hiệu, Tiến Thành đã phát triển thành công một mô hình học sâu có khả năng chẩn đoán các bệnh lý thường gặp trên hình ảnh X-quang lồng ngực ở bệnh nhân nhi. Thử nghiệm cho thấy mô hình đạt hiệu năng vượt trội so với các phương pháp hiện có. Đặc biệt, sau nghiên cứu này, lần đầu tiên, một bộ dữ liệu X-quang nhi quy mô lớn (trên 5,000 ca chụp), có dán nhãn và một thuật toán học sâu mới dự kiến sẽ được VinBigdata giới thiệu tới cộng đồng vào tháng 10 tới đây, thông qua nền tảng VinDr Lab.
Không chỉ Tiến Thành, mà Văn Dũng cũng có chung những cảm xúc đặc biệt tương tự. Với Dũng, đây không chỉ là cột mốc cho thấy sự trưởng thành về tư duy và kỹ năng làm AI, mà còn là công bố quốc tế đầu tiên, có ý nghĩa như một bước đệm để từ lập trình bước sang nghiên cứu, hiểu tận gốc vấn đề. Mất hơn ba tháng để hoàn thiện bài báo, với sự chỉ dẫn của đội ngũ các nhà khoa học, Đỗ Văn Dũng đã tham gia xây dựng một hệ thống học sâu có tên gọi DICOM Image Router, cho phép tự động phân loại các loại hình ảnh X-quang theo chỉ định chụp. Hệ thống này hoạt động như một bộ định tuyến hình ảnh giúp xác định chính xác các phim chụp X-quang theo từng bộ phận hoặc chỉ định chụp, trước khi chúng được gửi tới một mô hình AI chẩn đoán cụ thể.
Nhìn lại hành trình từ khi gia nhập Chương trình Đào tạo Kỹ sư AI Vingroup, đến khi trở thành thực tập sinh tại Trung tâm Xử lý ảnh y tế, VinBigdata, Dũng chia sẻ: “Trước đó, mình không học về AI. Mọi thứ hoàn toàn mới, ngay cả về ngôn ngữ lập trình. Tuy nhiên, chương trình đã trang bị cho mình những kiến thức nền tảng một cách bài bản, có hệ thống. Bên cạnh đó, khi bắt tay giải quyết từng bài toán cụ thể, mình đều được định hướng bởi đội ngũ chuyên gia, kỹ sư kì cựu và có thể sử dụng nguồn tài nguyên GPU dồi dào để đào tạo và tối ưu mô hình.”
Những thành công bước đầu của Tiến Thành và Văn Dũng là minh chứng cụ thể, thiết thực cho mục tiêu, sứ mệnh của Chương trình Đào tạo Kỹ sư AI Vingroup. Đồng thời, đây cũng là trái ngọt dành cho những nỗ lực của đội ngũ chuyên gia Trung tâm Xử lý ảnh y tế nói riêng và VinBigdata nói chung trong việc truyền cảm hứng, tri thức, kỹ năng công nghệ cho đội ngũ nhân lực trẻ. Dự kiến, khóa 02 của Chương trình sẽ khai giảng trong tháng 9/2021, kỳ vọng tiếp tục trở thành bệ phóng cho sự phát triển của những thế hệ khoa học – công nghệ tương lai.
Không chỉ có ý nghĩa về mặt đào tạo, hai nghiên cứu mới công bố cũng là cơ sở khoa học vững chắc để VinBigdata tiếp tục phát triển, cải thiện tính năng của giải pháp AI cho chẩn đoán hình ảnh y tế – VinDr. Hiện mô hình DICOM Image Router đã được tích hợp vào sản phẩm để hỗ trợ phân luồng phim chụp, nâng cao tính tự động của toàn hệ thống. Bên cạnh đó, nền tảng VinDr Lab cũng được đội ngũ phát triển đầu tư hoàn thiện, mở rộng quy mô và chất lượng dữ liệu ảnh y tế để chia sẻ với cộng đồng khoa học trong và ngoài nước.