(Nguyễn Tiến Dũng)
Trước hết, tôi xin cáo lỗi với các bạn quan tâm rằng tuy đầu năm nay tôi có nói trên FB là muốn mở CLB hướng dẫn học machine learning cho mọi người, nhưng sau đó xuất hiện những biến cố ngoài dự kiến khiến điều đó không thực hiện được. (Ai tò mò muốn biết vì sao thì xem giải thích phía dưới cùng). Tuy nhiên, trí tuệ nhân tạo và học máy là những lĩnh vực rất quan trọng của hiện tại và tương lai, nên tôi vẫn sẽ cố gắng cùng các cộng tác viên của Sputnik tìm cách đem lĩnh vực này đến cho mọi người tiếp cận một cách hiệu quả nhất. Đặc biệt các bạn trẻ mà nắm được AI/ML thì sẽ rất “có giá”, được rất nhiều công ty quốc tế và cả các công ty trong nước mời chào với mức lương thuộc loại cao nhất trong tất cả các ngành làm ăn chân chính, vì nhu cầu rất cao, và có rất nhiều vấn đề đang chờ đợi AI hỗ trợ.
Trong bài này, tôi muốn chia sẻ một vấn đề mà chắc là rất nhiều người thắc mắc: cách học AI tốt nhất là gì?
Theo tôi, muốn thực sự nắm được các kỹ năng kiến thức ML/AI để có thể dùng trong thực tế, thì không có cách nào khác là phải thực hành. Và cách thực hành tốt nhất hiện nay là tham gia các cuộc thi hay dự án. Nếu bạn chưa có kinh nghiệm thì khó mà tham gia dự án có ứng dụng thật ngay được, nhưng có thể tham gia thi.
Có nhiều platform tổ chức thi về AI khác nhau, nhưng trong đó nổi tiếng nhất có lẽ là kaggle.com, hiện là một công ty con của Google. Kaggle nhận tiền từ các tổ chức, công ty lớn khác nhau, ví dụ như Google, Airbus, Santander,để tổ chức các cuộc thi về AI cho tất cả mọi người trên thế giới tham dự. Ai cũng có thể tham dự, để tham dự chỉ cần đăng ký tài khoản miễn phí trên kaggle, và tuân thủ các luật lệ của các cuộc thi. Thậm chí không có máy tính để chạy machine learning vẫn có thể tham dự, vì kaggle cung cấp luôn cả máy miễn phí từ xa (có thể tải code lên “kernel” của kaggle và chạy thẳng trên đó).
Đối với các công ty lớn, họ bỏ ra vài trăm nghìn USD một lần cho một cuộc thi về một vấn đề họ quan tâm, để tìm ra người tài, tìm ra giải pháp AI cho họ, nhanh hơn và tốn ít chi phí hơn là nếu họ tự làm. Đối với cộng đồng những người quan tâm đến AI, thì các cuộc thi này là nơi để trao đổi, học hỏi được rất nhiều thứ.
Các vấn đề về AI được đem ra thi thì rất phong phú, từ xử lý phim ảnh đến xác định bệnh tật đến ước lượng giá nhà cửa, dự đoán khả năng vỡ nợ, v.v
Tất nhiên, được giải lớn thì rất tốt (tiền mặt một lần giải nhất có thể đến 50 ngàn USD, và hơn thế có thể bán thuật toán của mình với giá còn cao hơn nhiều). Nếu không được giải lớn mà được giải nhỏ (các loại huy chương) thì cũng tốt, cũng là thành tích có thể đem khoe chứng tỏ trình độ. Và kể cả không được giải gì (vì chỉ có dưới 10% người tham gia sẽ có giải) thì cũng tốt. Cái chính là sự cố gắng kiên trì bám trụ, cố gắng làm tốt lên mỗi ngày, cố gắng học hỏi từ những người cùng tham gia thi, v.v. Chỉ 2-3 tháng tham gia thi, với cố gắng hoàn thiện lên từng ngày, là đủ nâng tầm hiểu biết lên rất nhiều, hơn hẳn so với “học xuông” mà không có thực hành trong môi trường có cạnh tranh.
Tất nhiên, học AI đòi hỏi không chỉ thực hành mà cần cả nền tảng lý thuyết. Muốn biết lý thuyết thì có thể tìm đọc các sách, học theo các khoá có video miễn phí trên mạng từ các trường lớn như Stanford. Và đặc biệt là cần nền tảng toán học vững vàng, vì toán học và trí tuệ nhân tạo rất gần nhau, khó có thể giỏi trí tuệ nhân tạo nếu không giỏi toán.
Một ví dụ về ti kaggle, mà nhóm AI Toulouse do tôi lập ra từ cuối năm ngoái tham dự (đây cũng là lần đầu nhóm AI Toulouse tham gia thi trên kaggle):
Đây là một cuộc thi “tìm muối” (Salt Identification), vấn đề là nhìn các ảnh địa chấn (chụp cắt lát các lớp đất dưới mặt đất bằng siêu âm) phải xác đinh chỗ nào là muối chỗ nào không. (Vấn đề này liên quan đến thăm dò dầu hoả). Cho đến thời điểm viết bài này, có khoảng 2500 đội tham gia thi từ khắp thế giới. Trong đó có rất nhiều đội “sừng sỏ” là người Trung Quốc, Hàn Quốc, Nhật Bản, Nga, Ấn Độ, các nước phương tây, v.v. Người Việt (kể cả trong và ngoài nước) trên đó thì có vẻ rất hiếm. Trong số 100 đội đứng đầu bảng thì chỉ có 2 đội người Việt, một đội là những bạn làm cho một công ty Nhật Bản, và đội còn lại chính là AI Toulouse. Cuộc thi kéo dài tổng cộng 3 tháng, và đã diễn ra được gần hai tháng, chỉ còn hơn 1 tháng nữa kết thúc. Nhóm AI Toulouse học được rất nhiều điều hay từ cuộc thi, về rất nhiều khía cạnh khác nhau của AI xử lý ảnh (từ việc chọn các hàm loss ra sao, chọn các augmentation như thế nào, chọn các mô hình “lõi” gì, các block nào cho neural network, làm ensemble như thế nào, làm sạch data ra sao, hậu xử lý kết quả ra sao, v.v. đại loại là có rất nhiều thứ cần học trong học máy để áp dụng vào thực tế), và đang tiếp tục thử nghiệm nhiều thuật toán mới do nhóm tự tạo ra nhằm nâng thứ hạng của mình (hiện ở mức 70-80 trên tổng số 2500 đội).
Một điểm quan trọng cần chú ý: nên học và thi theo nhóm (chứ đừng nên làm riêng lẻ chỉ một người), thì mới học nhanh hơn, thi đạt kết quả tốt hơn!
Chúc ác bạn học về trí tuệ nhân tạo và tham gia các cuộc thi thật vui!
—
(1) Từ sau khi ông bộ trưởng giáo dục Phùng Xuân Nhạ bị phát hiện và tố giác đạo văn giả khoa học với các chứng cớ rõ ràng, và chính phủ vẫn để một người thiếu cả tư cách và trình độ như vậy làm lãnh đạo – một điều không thể tưởng tượng nổi ở bất cứ một nước văn minh nào – những người dám lên tiếng về vụ này, trong đó có tôi, liên tục bị tin tặc giấu mặt tấn công bằng đủ mọi cách. Cũng vì vụ này, cộng với sự vô trách nhiệm và tiếp tay cho kẻ xấu của FB, mà tôi phải đóng tài khoản FB và quyết định tẩy chay FB vĩnh viễn.