Đối với nhiều người trong chúng ta đang đổi mới trong không gian AI, chúng ta đang làm việc trong lãnh thổ chưa được khám phá. Với tốc độ phát triển công nghệ mới của các công ty AI, người ta có thể coi công việc kiên trì ở hậu trường là điều đương nhiên. Nhưng trong một lĩnh vực như XR, nơi sứ mệnh là xóa mờ ranh giới giữa thế giới thực và thế giới kỹ thuật số – hiện tại không có nhiều dữ liệu hoặc nghiên cứu lịch sử để dựa vào; vì vậy chúng ta cần phải suy nghĩ sáng tạo.

Mặc dù thuận tiện nhất là dựa vào trí tuệ học máy thông thường và các phương pháp thực hành đã được thử và đúng, nhưng điều này thường không thể thực hiện được (hoặc giải pháp đầy đủ) trong các lĩnh vực mới nổi. Để giải quyết những vấn đề chưa từng được giải quyết trước đây, chúng cần được tiếp cận theo những cách mới.

Đó là một thách thức buộc bạn phải nhớ lý do ngay từ đầu bạn đã bước vào lĩnh vực kỹ thuật, khoa học dữ liệu hoặc phát triển sản phẩm: niềm đam mê khám phá. Tôi trải nghiệm điều này hàng ngày trong vai trò của mình tại Ultraleap , nơi chúng tôi phát triển phần mềm có thể theo dõi và phản hồi các chuyển động của bàn tay con người trong môi trường thực tế hỗn hợp. Rất nhiều điều mà chúng tôi nghĩ rằng chúng tôi đã biết về các mô hình học máy đào tạo lại xuất hiện trong công việc của chúng tôi, vì bàn tay con người — cùng với các vật thể và môi trường mà nó gặp phải — là cực kỳ khó đoán.

Dưới đây là một số phương pháp mà nhóm của tôi và tôi đã thực hiện để hình dung lại thử nghiệm và khoa học dữ liệu nhằm mang lại sự tương tác trực quan cho thế giới kỹ thuật số, điều đó chính xác và mang lại cảm giác tự nhiên như trong thế giới thực.

Đổi mới trong dòng chảy AI

Khi đổi mới trong một lĩnh vực còn non trẻ, bạn thường phải đối mặt với những hạn chế dường như mâu thuẫn với nhau. Nhóm của tôi được giao nhiệm vụ nắm bắt sự phức tạp của chuyển động của bàn tay và ngón tay cũng như cách bàn tay và ngón tay tương tác với thế giới xung quanh. Tất cả điều này được đóng gói thành các mô hình theo dõi bàn tay vẫn phù hợp với phần cứng XR trên điện toán hạn chế. Điều này có nghĩa là các mô hình của chúng tôi — mặc dù tinh vi và phức tạp — phải chiếm ít dung lượng lưu trữ hơn đáng kể và tiêu thụ ít năng lượng hơn đáng kể (tỷ lệ 1/100.000) so với các LLM khổng lồ đang thống trị các tiêu đề. Nó đặt ra cho chúng ta một thách thức thú vị, đòi hỏi phải thử nghiệm và đánh giá một cách tàn nhẫn các mô hình của chúng ta trong ứng dụng trong thế giới thực.

Nhưng vô số thử nghiệm và thử nghiệm đều đáng giá: việc tạo ra một mô hình mạnh mẽ mà vẫn mang lại chi phí suy luận, mức tiêu thụ điện năng và độ trễ thấp là một điều kỳ diệu có thể được áp dụng trong điện toán ranh giới ngay cả bên ngoài không gian XR.

Những hạn chế mà chúng tôi gặp phải khi thử nghiệm cũng sẽ ảnh hưởng đến các ngành khác. Một số doanh nghiệp sẽ gặp những thách thức riêng do sự phức tạp trong lĩnh vực ứng dụng của họ, trong khi những doanh nghiệp khác có thể có dữ liệu hạn chế để xử lý do ở trong một thị trường ngách mà các công ty công nghệ lớn chưa chạm tới.

Mặc dù các giải pháp một kích thước phù hợp cho tất cả có thể đủ cho một số nhiệm vụ nhưng nhiều miền ứng dụng cần giải quyết các vấn đề thực tế, đầy thách thức cụ thể đối với nhiệm vụ của chúng. Ví dụ: dây chuyền lắp ráp ô tô triển khai mô hình ML để kiểm tra lỗi. Những mô hình này phải vật lộn với hình ảnh có độ phân giải rất cao cần thiết để xác định các khiếm khuyết nhỏ trên diện tích bề mặt lớn của ô tô. Trong trường hợp này, ứng dụng yêu cầu hiệu năng cao, nhưng vấn đề cần giải quyết là làm thế nào để đạt được tốc độ khung hình thấp nhưng độ phân giải cao, mô hình.

Đánh giá kiến ​​trúc mô hình để thúc đẩy đổi mới

Một bộ dữ liệu tốt là động lực thúc đẩy bất kỳ bước đột phá AI thành công nào. Nhưng điều gì làm cho một tập dữ liệu “tốt” cho một mục tiêu cụ thể? Và khi bạn đang giải quyết các vấn đề chưa được giải quyết trước đây, làm sao bạn có thể tin tưởng rằng dữ liệu hiện có sẽ phù hợp? Chúng tôi không thể cho rằng các số liệu tốt cho một số nhiệm vụ ML sẽ chuyển thành hiệu suất của một nhiệm vụ kinh doanh cụ thể khác. Đây là nơi chúng ta được kêu gọi đi ngược lại “sự thật” ML thường được chấp nhận và thay vào đó tích cực khám phá cách chúng ta gắn nhãn, làm sạch và áp dụng cả dữ liệu mô phỏng và dữ liệu trong thế giới thực.

Về bản chất, miền của chúng tôi gặp khó khăn trong việc đánh giá và yêu cầu đảm bảo chất lượng thủ công – được thực hiện bằng tay. Chúng tôi không chỉ xem xét các số liệu chất lượng của dữ liệu của chúng tôi. Chúng tôi lặp lại các tập dữ liệu và nguồn dữ liệu của mình rồi đánh giá chúng dựa trên chất lượng của các mô hình mà chúng tạo ra trong thế giới thực. Khi đánh giá lại cách chúng tôi xếp loại và phân loại dữ liệu của mình, chúng tôi thường tìm thấy các tập dữ liệu hoặc xu hướng mà chúng tôi có thể đã bỏ qua. Giờ đây, với những tập dữ liệu đó và vô số thử nghiệm cho chúng tôi thấy dữ liệu nào không nên dựa vào, chúng tôi đã mở ra một con đường mới mà trước đây chúng tôi đã bỏ lỡ.

Nền tảng theo dõi tay mới nhất của Ultraleap, Hyperion , là một ví dụ điển hình về điều này. Những tiến bộ trong bộ dữ liệu của chúng tôi đã giúp chúng tôi phát triển tính năng theo dõi bàn tay phức tạp hơn, có thể theo dõi chính xác các cử chỉ vi mô cũng như chuyển động của tay ngay cả khi người dùng đang cầm một đồ vật.

 Lùi một bước nhỏ, tiến một bước lớn

Mặc dù tốc độ đổi mới dường như không bao giờ chậm lại nhưng chúng ta có thể làm được. Chúng tôi đang làm công việc thử nghiệm, học hỏi, phát triển và khi dành thời gian để làm việc đó, chúng tôi thường tạo ra thứ gì đó có giá trị hơn nhiều so với khi chúng tôi làm theo sách vở và gấp rút đưa ra cải tiến công nghệ tiếp theo. Không có gì thay thế được cho những đột phá xảy ra khi chúng ta khám phá các chú thích dữ liệu, đặt câu hỏi về nguồn dữ liệu và tự xác định lại các chỉ số chất lượng. Và cách duy nhất chúng ta có thể làm điều này là thử nghiệm trong miền ứng dụng thực tế với hiệu suất của mô hình được đo lường đối với nhiệm vụ. Thay vì coi những yêu cầu và hạn chế không phổ biến là những hạn chế, chúng ta có thể đón nhận những thách thức này và biến chúng thành cơ hội để đổi mới và cuối cùng là lợi thế cạnh tranh.

Tham khảo thêm: