Tôi luôn mong muốn thu hẹp khoảng cách giữa nghiên cứu và ứng dụng trí tuệ nhân tạo (AI) tại Việt Nam, nhằm giúp các tổ chức và doanh nghiệp nâng cao năng lực cạnh tranh. Dù việc xây dựng sản phẩm ứng dụng AI phức tạp hơn, nhưng nó mang lại hiệu quả vượt trội trong tự động hóa quy trình và tiết kiệm chi phí lâu dài.
Nền tảng kiến thức của tôi được xây dựng từ khi tốt nghiệp Kỹ sư Toán Tin tại Đại học Bách Khoa Hà Nội năm 2019. Sau đó, tôi tiếp tục học Thạc sĩ ngành Toán và Tin học tại chính ngôi trường này. Quá trình học tập đã trang bị cho tôi kiến thức chuyên sâu về các thuật toán và mô hình AI.
Trong sự nghiệp của mình, tôi đã đảm nhận nhiều vai trò quan trọng, thể hiện sự phát triển và đóng góp trong lĩnh vực AI. Cụ thể:
* Từ tháng 1/2015 đến tháng 8/2017, tôi giữ vị trí CTO tại Uland.
* Tiếp theo, từ tháng 9/2017 đến tháng 10/2019, tôi là AI Team Lead tại Cinnamon AI lab.
* Từ tháng 10/2019 đến nay, tôi đảm nhiệm vị trí CEO & CTO tại Techainer.
Những vị trí này cho thấy tôi không chỉ tham gia vào nghiên cứu và phát triển kỹ thuật mà còn quản lý, định hướng sản phẩm và lãnh đạo các nhóm phát triển AI. Tôi đã tham gia lãnh đạo, nghiên cứu và triển khai các dự án với quy mô đầu tư từ hàng trăm nghìn đến hàng chục triệu đô la, tiếp cận đến hàng triệu người dùng.

Quá trình nghiên cứu và phát triển AI của tôi được thể hiện rõ nét qua nhiều dự án đa dạng, ứng dụng AI vào nhiều lĩnh vực khác nhau:
**Xử lý ảnh và Thị giác máy tính:**
* **Dự án tự động hóa xử lý Báo cáo tài chính (Financial Statement Understanding):** Nhằm tối ưu hóa quyết định tài chính, tôi đã xây dựng mô hình Siamese để phân loại, bóc tách thông tin trong báo cáo tài chính, và huấn luyện mô hình BERT để phát hiện tác động (tốt/xấu) của thông tin lên công ty từ báo cáo tài chính và mạng xã hội. Các công nghệ sử dụng bao gồm Tensorflow, Pytorch, Scikit-learn, Django, Redis, Graphql, Neo4j. Độ chính xác đạt 98% trên tập mẫu 10.000 công ty.
* **Dự án nhận diện vân tay (FingerPrint Biometrics):** Để đáp ứng yêu cầu nhận diện chính xác 100% dữ liệu vân tay cho ngân hàng, tôi đã phát triển hệ thống nhận dạng vân tay từ nghiên cứu “Deep and Accurate Fingerprint Recognition based on Minutiae detection” để nhận diện giữa hàng triệu vân tay, với mục tiêu F1 Score 88% và thời gian khớp dưới 1 giây. Các nhiệm vụ bao gồm huấn luyện mô hình phân đoạn sâu để phát hiện vân tay từ thẻ căn cước và ảnh cảm biến, huấn luyện mô hình phát hiện chi tiết nhỏ (minutiae) và loại chi tiết nhỏ, và triển khai thuật toán khớp vân tay hiệu suất cao. Các công nghệ chính là Tensorflow, Cuda, ElasticSearch, MongoDB.
* **Dự án nhận diện và chống giả mạo khuôn mặt:** Để triển khai hệ thống Face Camera AI nhận diện khách hàng cho ngân hàng và tổ chức tài chính, tôi đã phát triển hệ thống nhận diện khuôn mặt để phát hiện, theo dõi, nhận diện và thông báo từ nhiều luồng camera (hơn 400 luồng trên toàn quốc) cho ngành ngân hàng, với mục tiêu độ chính xác trên 95% cho khách hàng VIP/Non-VIP và trên 90% khi xác định khách hàng vào chi nhánh ngân hàng. Tôi đã cải thiện mô hình phát hiện khuôn mặt và điểm mốc khuôn mặt lên 98% và huấn luyện mô hình nhận diện tốt hơn trên khuôn mặt người Việt. Các framework sử dụng gồm Tensorflow, Keras, Pytorch, Mxnet, ElasticSearch, Open Distro.
* **Dự án nhận diện giấy tờ tùy thân eKYC:** Tôi đã xây dựng pipeline nhận dạng giấy tờ tùy thân (Chứng minh thư, bằng lái xe, hộ chiếu,…) với độ chính xác trên 98% và xử lý dưới 1 giây cho 1 loại thẻ và 200 loại hộ chiếu. Các công việc bao gồm huấn luyện phát hiện thẻ bằng Mask RCNN (độ chính xác trên 99%), phát hiện và nhận dạng dòng chữ (độ chính xác trên 99%), và huấn luyện Named Entity Recognition và Address Normalization. Frameworks: Tensorflow, Pytorch, Tensorflow Lite, Tensorflow JS. Dự án được triển khai trên một số ngân hàng, nhiều tổ chức tài chính, xử lý hàng trăm nghìn giấy tờ tùy thân mỗi tháng.
* **Dự án Smart AI Camera:** Tôi đã xây dựng hệ thống xử lý ảnh bao gồm các module phân loại/phát hiện/theo dõi đối tượng. Tôi đã cải thiện hiệu suất thuật toán trích xuất đặc trưng cho phân loại đối tượng bị bỏ rơi/di chuyển (ARO) và cải thiện độ chính xác của phân loại ARO trong thời gian thực, đếm số lượng người bằng thuật toán Faster RCNN cải tiến. Triển khai trên hàng trăm Camera của nhiều nhà máy. Framework: Caffe-SSD.
* **Dự án Camera AI bệnh viện thông minh:** Tôi đã phát triển module nhận dạng tư thế người (gập người, nằm, ngồi, đứng, ngã), biểu cảm khuôn mặt người (buồn bã, hạnh phúc, tức giận, ngạc nhiên, buồn chán, sợ hãi) sử dụng các đặc trưng HOG, SURF, mô hình KNN, BOW và SVM. Ứng dụng hỗ trợ chăm sóc người già trong bệnh viện.
**Xử lý Ngôn ngữ Tự nhiên (NLP):**
* **Natural Language Processing:** Tôi đã phát triển hệ thống NLP trong lĩnh vực giải trí, bao gồm xây dựng cơ sở dữ liệu và cải thiện hiệu suất module tìm kiếm mờ (fuzzy searching) sử dụng khoảng cách Levenshtein.
* **Dự án AI Tutor:** Tôi đã phát triển hệ thống LLM tiếng Việt, tập trung vào khả năng xử lý tiếng Việt và khả năng hỗ trợ học theo tiêu chuẩn giáo dục (đưa ra hỗ trợ + kiến thức giải chứ không đưa đáp án ngay). Kiến thức được hỗ trợ được đưa đến học sinh qua một hệ thống kiểm duyệt chặt chẽ để đảm bảo nội dung chuẩn từ Nhà xuất bản giáo dục. Hệ thống được đặt mục tiêu triển khai đến hàng chục triệu học sinh của Việt Nam.
Quá trình nghiên cứu và phát triển AI của tôi là một chuỗi các hoạt động liên tục, từ nắm vững lý thuyết đến triển khai các mô hình phức tạp và xây dựng các hệ thống AI có tính ứng dụng cao trong nhiều lĩnh vực khác nhau. Tôi không chỉ là một kỹ sư có chuyên môn sâu mà còn là một nhà lãnh đạo có khả năng định hướng phát triển công nghệ.
Những thành tựu nổi bật của tôi bao gồm việc tham gia và đồng tác giả nhiều dự án và công trình AI quan trọng, tập trung vào các lĩnh vực xử lý ảnh, thị giác máy tính và xử lý ngôn ngữ tự nhiên:
* **Hệ thống nhận dạng vân tay và khuôn mặt cho Ngân hàng P:** Phát triển hệ thống nhận dạng vân tay để nhận diện hàng triệu dấu vân tay với độ chính xác cao và thời gian khớp dưới 1 giây, phục vụ khoảng 2.360.000 người sử dụng. Đồng thời, phát triển hệ thống nhận diện khuôn mặt có khả năng mở rộng cho ngành ngân hàng, đạt độ chính xác cao trong việc nhận diện khách hàng VIP/Non-VIP và nhận diện khách hàng khi vào chi nhánh. Mô hình phát hiện khuôn mặt và điểm mốc đã cải thiện lên 98% và huấn luyện mô hình nhận dạng tốt hơn trên khuôn mặt người Việt.
* **Hệ thống Biometrics (sinh trắc học) cho một ngân hàng trong Top 10 Ngân hàng thương hiệu giá trị nhất Việt Nam 2024,** với 7.000.000 người sử dụng: Đảm bảo khả năng ngăn chặn những khách hàng giả mạo mà không ảnh hưởng nhiều đến trải nghiệm khách hàng. Giải pháp đang được ứng dụng để thực hiện các nghiệp vụ mở tài khoản hoặc các nghiệp vụ khác cần định danh người dùng trực tiếp. Hệ thống đang xử lý hàng tháng gần 300.000 lượt xác thực khuôn mặt với tỷ lệ sai sót dưới 5%.
* **Hệ thống EKYC cho nhà mạng Vietnamobile:** Có thể triển khai bán SIM qua kênh địa lý, hiện tại phối hợp để đẩy bán SIM lên kênh trực tuyến. Hệ thống EKYC được triển khai tại chuỗi chi nhánh Vietnamobile, giúp hơn 5000 khách hàng Vietnamobile mỗi tháng đăng ký dịch vụ từ xa.
* **Hệ thống hỗ trợ đăng ký kích hoạt SIM của nhà mạng Mytel tại thị trường Myanmar:** Đạt tỷ lệ chính xác 90% trong việc trích xuất thông tin từ chữ viết tay trên thẻ National Identity Card (NRC) và tăng tỷ lệ chống giả mạo lên 50%, giúp định danh người dùng nhanh chóng và an toàn.
* **Hệ thống Biometrics & OCR:** Giải pháp đang được triển khai để thực hiện các nghiệp vụ mở tài khoản hoặc các nghiệp vụ khác cần định danh người dùng trực tiếp. Sau quá trình chuyển giao đào tạo, đội ngũ nhân viên ngân hàng đã nắm vững cách thức vận hành và tự chủ được việc vận hành giải pháp.
* **Hệ thống học trực tuyến cấp quốc gia:** Triển khai trên một số trường trọng điểm, cho phép các khóa học và sinh viên của các trường có thể học và được công nhận tín chỉ chéo giữa các trường.
* **Giải pháp loa phường IP Radio:** Hiện đã được ứng dụng trên 10 tỉnh thành của Việt Nam, dự kiến sẽ phủ ít nhất 50% số tỉnh thành trên cả nước, nhằm đem đến giá trị truyền thông bền vững. Với nền tảng công nghệ điều khiển qua Internet, loa phường thế hệ mới là biểu hiện sinh động của chuyển đổi số (IoT, cloud, AI…).
**Giải thưởng:**
* Dự án Camera AI – Giải nhất Yody Hackathon 2022.
* Giải nhất AWS Hackdays Vietnam cho giải pháp thu thập kiến thức về báo cáo tài chính năm 2018.
* Dự án Camera AI – Giải ba Youth Innovation 2022.
* Dự án eKYC đạt giải Top 13 Hệ thống giải AI Tech Matching 2022.
* Giải nhất thử thách xe tự lái của Đại học Bách khoa Hà Nội năm 2016.
* Giải nhì Olympic Tin học Việt Nam năm 2014.
Admin
Nguồn: VnExpress