Chuyên gia Việt: Dùng dữ liệu tăng 4% hiệu quả cho Airbnb

Tại tọa đàm “Xử lý và phân tích dữ liệu – Động lực cho chuyển đổi số quốc gia” do Hiệp hội Dữ liệu quốc gia tổ chức, bà Hạnh Phạm, người có nhiều năm kinh nghiệm làm việc tại các tập đoàn công nghệ hàng đầu thế giới, đã chia sẻ về vai trò then chốt của khoa học dữ liệu trong mọi hoạt động của Airbnb.

Thiếu tá Đào Đức Triệu, Tổng thư ký Hiệp hội Dữ liệu quốc gia phát biểu tại tọa đàm. Ảnh: Minh Sơn
Ông Đào Đức Triệu phát biểu tại tọa đàm Hiệp hội Dữ liệu quốc gia. Ảnh: Internet

Bà Hạnh, người từng giữ vị trí lãnh đạo khoa học dữ liệu mảng tăng trưởng và bán hàng tại Airbnb, cho biết nền tảng này tạo ra hơn một tỷ sự kiện dữ liệu mỗi ngày và thực hiện hơn 2.000 thử nghiệm mỗi năm với đội ngũ hơn 200 nhà khoa học và kỹ sư dữ liệu. Airbnb là một nền tảng công nghệ kết nối những người có phòng trống với khách du lịch trên toàn cầu.

Theo bà Hạnh, dữ liệu là một nguồn tài nguyên vô cùng giá trị, thậm chí còn quý hơn cả khoáng sản. Việc khai thác hiệu quả nguồn tài nguyên này đã giúp Airbnb tăng 4% tỷ lệ đặt phòng thành công. Quy trình khai thác dữ liệu tại Airbnb được thực hiện theo một vòng lặp liên tục: Khai thác dữ liệu, xây dựng mô hình, chia sẻ kết quả, và sau đó quay lại khai thác dữ liệu.

Trong giai đoạn đầu tiên, nhóm nghiên cứu sử dụng các công cụ như Airpal và Superset để phân tích lịch sử đặt phòng. Từ hàng triệu bản ghi đặt chỗ, họ nhận thấy rằng các chủ nhà thường ưu tiên những yêu cầu đặt phòng có thể lấp đầy khoảng trống trong lịch của họ, tức là những lượt đặt phòng liền kề với các booking đã có trước đó. Ngược lại, nếu một yêu cầu tạo ra nhiều ngày trống giữa các lượt khách, chủ nhà có xu hướng từ chối. Biểu đồ phân tích cho thấy rõ ràng tỷ lệ chấp nhận yêu cầu đặt phòng giảm đáng kể khi số ngày trống tăng lên. Bà Hạnh chia sẻ: “Ở vị trí là một nền tảng kết nối, sẽ rất đáng tiếc nếu khách hàng đã thích một căn hộ và muốn đặt nhưng chủ nhà lại từ chối.”

Để biến những dữ liệu này thành hành động cụ thể, bước thứ hai là tích hợp chúng vào mô hình xếp hạng tìm kiếm của hệ thống gợi ý kết quả trên Airbnb và Google. Nhóm nghiên cứu sử dụng công cụ Airflow để xây dựng một quy trình đưa dữ liệu đã được xử lý từ bước đầu vào mô hình. Tại đây, thuật toán xếp hạng sẽ được điều chỉnh để ưu tiên hiển thị những căn hộ có lịch đặt phòng phù hợp hơn với nhu cầu của cả khách và chủ nhà.

Ví dụ, khi một người dùng tìm kiếm chỗ ở, hệ thống không chỉ xem xét các yếu tố như vị trí, giá cả hay đánh giá, mà còn cân nhắc xem yêu cầu của người dùng có phù hợp với lịch trống của chủ nhà hay không. Nếu yêu cầu phù hợp, khả năng được chấp nhận sẽ cao hơn, từ đó mang lại trải nghiệm tốt hơn cho người dùng.

Bà Hạnh cho biết, sau khi triển khai, kết quả đo lường cho thấy tỷ lệ yêu cầu đặt phòng được chủ nhà chấp nhận đã tăng 4%. Bà nhấn mạnh: “Đây là một con số rất lớn đối với một nền tảng có doanh thu hàng tỷ đô la.”

Bà Hạnh Phạm - Giám đốc Khoa học dữ liệu tại Pinterest, cựu lãnh đạo nhóm dữ liệu tại Airbnb, chia sẻ tại tọa đàm của Hiệp hội Dữ liệu quốc gia, ngày 28/5/2025. Ảnh: Lưu Quý
Bà Hạnh Phạm (Pinterest): Kinh nghiệm khoa học dữ liệu từ Airbnb. Ảnh: Internet

Tuy nhiên, quá trình này không dừng lại ở việc triển khai kỹ thuật. Kết quả của các thử nghiệm được lưu trữ và chia sẻ thông qua hệ thống nội bộ bằng cách sử dụng Knowledge Repo, một kho tri thức mở giúp các nhóm khác trong công ty có thể học hỏi, đánh giá hiệu quả và tái sử dụng mô hình trong các ngữ cảnh riêng của họ. Bà Hạnh nhấn mạnh rằng việc chia sẻ thông tin là đặc biệt quan trọng để đảm bảo tính liên tục khi nhân sự thay đổi hoặc khi hệ thống công nghệ được tái cấu trúc.

Hiện tại, bà Hạnh đang giữ vị trí Giám đốc dữ liệu người dùng tại Pinterest, một mạng xã hội về hình ảnh hàng đầu thế giới. Đồng thời, bà cũng là đồng sáng lập của Skin AI, một startup ứng dụng trí tuệ nhân tạo trong việc cá nhân hóa chăm sóc da dựa trên khoa học dữ liệu.

Theo bà Hạnh, các công ty ở mọi lĩnh vực và quy mô đều có thể ứng dụng dữ liệu để nâng cao hiệu quả hoạt động. Ví dụ, trong ngành bán lẻ, dữ liệu có thể giúp cải thiện quá trình phát triển sản phẩm thông qua phản hồi trực tuyến, thực hiện kiểm thử A/B, cá nhân hóa trải nghiệm và rút ngắn thời gian đưa sản phẩm mới ra thị trường.

Với kinh nghiệm làm việc tại các tập đoàn lớn, bà Hạnh đưa ra ba nguyên tắc cốt lõi khi làm việc với dữ liệu. Thứ nhất, một nhà khoa học dữ liệu giỏi không chỉ thực hiện theo yêu cầu mà còn cần trở thành một đối tác tư duy, chủ động hiểu và giải quyết các bài toán thực sự của doanh nghiệp. Thứ hai, chất lượng dữ liệu là yếu tố then chốt, bởi vì nếu dữ liệu đầu vào không đáng tin cậy, thì kết quả phân tích dù có tinh vi đến đâu cũng trở nên vô nghĩa, thậm chí có thể gây hại. Thứ ba, bà Hạnh nhấn mạnh rằng các kỹ sư dữ liệu và hệ thống đường ống dữ liệu là những “người hùng thầm lặng” đảm bảo dữ liệu được lưu chuyển đúng cách, đồng thời theo dõi và kiểm soát chặt chẽ quyền truy cập, từ đó giúp tổ chức sử dụng dữ liệu một cách an toàn và hiệu quả.

Tại hội thảo, Thiếu tá Đào Đức Triệu, Tổng thư ký Hiệp hội Dữ liệu quốc gia, nhận định rằng Việt Nam đang đứng trước một cơ hội lịch sử khi bước vào kỷ nguyên chuyển đổi số, với tiềm năng to lớn từ dữ liệu, có thể tạo ra một thế hệ các công ty lớn mạnh. Ông nhấn mạnh rằng dữ liệu là một nguồn tài nguyên có giá trị lớn và không chỉ có thể khai thác một lần, mà còn có thể tạo ra những giá trị mới khi được kết nối và khai thác một cách hiệu quả. Ông cũng lưu ý rằng các doanh nghiệp cần đảm bảo dữ liệu không bị lạm dụng trong quá trình khai thác.

Đại diện Hiệp hội Dữ liệu quốc gia cho biết sẽ tiếp tục thực hiện các hoạt động nâng cao nhận thức và trang bị kiến thức chuyên sâu về phân tích và xử lý dữ liệu, từ đó thúc đẩy việc ứng dụng các công nghệ dữ liệu hiện đại vào tiến trình phát triển kinh tế số và chuyển đổi số quốc gia.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *