(Nguyễn Tiến Dũng)
Đây là câu chuyện đang xảy ra về nhóm AI Toulouse tham dự vào cuộc thi “ISIC 2018” về ung thư da. Tuy rằng câu chuyện này còn lâu mới kết thúc, nhưng đã có thể kể dần.
Ung thư da là một loại bệnh rất phổ biến trên thế giới. Người ta ước tính là ở Mỹ có đến 1/5 số người sẽ bị mắc ung thư da. Ung thư da cũng rất đa dạng, không phải dạng nào cũng nguy hiểm như nhau, nhưng có những dạng nguy hiểm, như là melanoma ác tính, nếu không phát hiện sớm thì tỷ lệ tử vong lên đến 90%, và mỗi năm trên thế giới có hàng chục ngàn người chết vì ung thư da. Bởi vậy việc chẩn đoán sớm ra đúng bệnh là điều quan trọng.
Mặt khác, việc chẩn đoán bệnh ung thư da (cũng như nhiều loại bệnh khác) là một việc khá tốn kém phức tạp. Người ta nói rằng, ngay cả các bác sĩ trong ngành chẩn đoán chỉ đúng được có 50% các trường hợp. Niềm hy vọng bây giờ đặt vào trí tuệ nhân tạo có khả năng chẩn đoán chính xác hơn nhiều so với bác sĩ thông thường, và cũng đỡ tốn kém hơn nhiều. (Có thể gửi thông tin từ xa đến, không cần phải đích thân đến nơi). Trên tạp chí Nature năm 2017 có hẳn một bài báo quảng cáo rùm beng cho việc này, khi có một nhóm các nhà nghiên cứu sử dụng học sâu (deep learning) dựa trên một tệp ảnh hơn 120 ngàn bức ảnh liên quan ung thư da đã cho ra được một “con” AI (trí tuệ nhân tạo) chẩn đoán ung thư da tốt hơn bác sĩ.
Cũng năm 2017, Tổ chức hợp tác quốc tế về ảnh da (International Skin Image Cooperation, gọi tắt là ISIC) tổ chức cuộc thi ISIC2017 về AI chẩn đoán ung thư da, do công ty công ty tin học cho ung thư Canfield Scientific (https://www.canfieldsci.com/) tài trợ. Mục đích của cuộc thi là phát triển AI giúp chẩn đoán ung thư da cho chính xác. Trong cuộc thi ISIC2017, các ảnh da chỉ thuộc 3 loại bệnh, và nhóm được gỉai nhất cho việc phân loại này chẩn đoán được ảnh nào thuộc loại bệnh nào với độ chính xác khoảng 85%.
Năm nay ISIC2018 tiếp tục được tổ chức, từ tháng 4 kéo dài đến cuối tháng 7. Do “trời xui đất khiến”, nhóm AI Toulouse tình cờ biết được về cuộc thi nào vào ngày 04/07 (cách đây 3 tuần) trong lúc đi tìm các ảnh bệnh da cho một dự án khác, và quyết định nhảy vào cuộc thi. So với các nhóm khác tham gia thi ISIC2018 thì là bị thiệt thòi về mặt thời gian, vì chỉ có hơn 3 tuần để tham dự thay vì 4 tháng, nhưng nhóm vẫn quyết tâm tham gia, ít ra thì cũng là để học hỏi được các thuật toán tốt dùng cho dự án khác của mình.
Tương tự như năm 2017, cuộc thi ISIC2018 (xem: https://challenge2018.isic-archive.com/) gồm có 3 phần (3 tasks): Task 1 là khoanh vùng bị viêm trên ảnh da (lesion segmentation), Task 2 là khoanh vùng các miền nhỏ của vùng bị viêm có các tính chất đặc biệt trên ảnh (gọi là attribute detection: chỗ nào có hình như mạng tổ ong, chỗ nào có nhiều đốt nhỏ nối lên, chỗ nào có những đường màu da nhạt đi, v.v., vì các bác sĩ cho rằng các tính chất đặc biệt đó có thể dùng làm những đặc điểm nhận biết phân biệt các bệnh ung thư da với nhau). Task 3, có thể coi là task quan trọng nhất, chính là việc phân loại bệnh dựa trên ảnh.
Khác với năm 2017, năm nay các ảnh liên quan ung thư da của cuộc thi bao trùm không chỉ 3, mà là 7 loại bệnh da khác nhau liên quan ung thư da, trong đó có: Melanoma (loại ung thư da nguy hiểm nhất), Basal Cell Carcimona (ít khi chết người như melanoma nhưng cũng gây tai hại nặng), DermatoFibroma (loại nổi cục sần lên, thường là không nguy hiểm và không cần chữa chạy gì nếu không vì lý do thẩm mĩ), Vascular (loại nổi sưng mạch máu) v.v. Phân ra thành 7 loại sao cho đúng tất nhiên là khó hơn so với chỉ 3 loại. Bù lại, ra được kết quả tốt thì ý nghĩa thực tiễn cao hơn nhiều so với năm ngoái. Hơn nữa, năm nay giới AI có các thuật toán mới tốt hơn, máy tính mới mạnh hơn, nên tất nhiên kỳ vọng cũng phải cao hơn.
Mỗi khi nhóm AI Toulouse do tôi làm “chùm sò” tụ tập chém gió thì có thể có đến mười mấy người tham dự, nhưng thường khi làm việc gì đó cụ thể thì chỉ có ít người thôi. Lần này, đội tham gia thi ISIC2018 gồm 5 người: ngoài tôi ra còn 4 thanh niên (2 nữ hai nam) là nghiên cứu sinh hoặc postdoc ngành toán. So với các nhóm khác, điểm yếu của chúng tôi thì nhiều: tham gia quá muộn, máy móc cọc cạch (các nhóm ở các viện tin học và số liệu thì thừa thãi máy tính hiệu suất cao, còn chúng tôi “chắt bóp” được 02 cái PC tạm gọi là dùng được cho deep learning), kinh nghiệm ít (lính mới tò te được có 1 năm đi lên từ số 0). Nhưng có một lợi thế mà hiếm nhóm nào có: đó chính là toán học. Sự hiểu biết về toán học cho phép nhóm AI Toulouse phân tích các thuật toán, “ngửi” xem thuật toán nào tốt, và đưa ra các cấu trúc thuật toán deep learning mới có nhiều triển vọng.
Bằng chứng là, trong khi có những nhóm khác chủ yếu dùng các thuật toán “ăn sẵn” (như là MaskCNN của tụi FacebookAI đang có tiếng hiện nay) và công bố đạt kết quả validation cho Task 3 (phân loại bệnh) đến 86% thì chúng tôi dùng một thuật toán mới “tự biên tự diễn” gọi là Z-Net (tất nhiên có “đứng trên vai những người khổng lồ khác”) và chỉ sau có hơn một ngày cho máy chạy training sau khi viết hoàn thiện thuật toán đã đạt được mức độ chính xác trên tập validation 140 ảnh (tập này được tách ra từ đầu để kiểm tra độ chính xác, hoàn toàn không dùng tới trong quá trình máy học) đạt 87% rồi! Mà đó là máy còn đang học dang dở, nên còn hy vọng là sau thêm 1-2 ngày học nữa (cho đến hạn nộp bài thi) độ chính xác sẽ còn cao hơn nữa!
… (tuần sau sẽ viết tiếp, và kể lại nhiều tình tiết thú vị trong quá trình làm machine learning này)