Kuaishou ra mắt mô hình video AI Kling với hàng loạt tính năng từng giúp Sora của OpenAI thu hút sự chú ý. Kuaishou, nền tảng chia sẻ video ngắn có quy mô lớn thứ hai Trung Quốc, hôm 6/6 ra AI tạo video từ văn bản mang tên Kling sở hữu nhiều tính năng nổi bật như cải thiện chất lượng chuyển động, bám sát nội dung mô tả và có thể tạo chuỗi khung hình khác nhau.

Tháng 2 năm nay, OpenAI đã giới thiệu mô hình tạo video Sora, có thể tạo video độ nét cao, dài một phút. Sora thậm chí còn chưa được ra mắt rộng rãi thì một mô hình tạo video khác đã thu hút sự chú ý. Kuaishou Technology, công ty Trung Quốc nổi tiếng với nền tảng video ngắn, đã ra mắt mô hình tạo video có tên Kling.

Theo báo cáo, Kling sử dụng công nghệ tương tự Sora và có thể tạo video độ nét cao 1080p với thời lượng tối đa hai phút. Mô hình này có thể tạo các chuyển động thực tế quy mô lớn, mô phỏng các đặc điểm của thế giới vật lý.

Thứ Năm vừa qua, công ty đã phát hành video demo giới thiệu khả năng tạo video của Kling. Theo báo cáo, mô hình này hiện đang mở cho người dùng dùng thử và trong một số trường hợp, nó có thể tạo ra video vượt trội hơn hẳn so với Sora.

Mô hình video Kling được phát triển bởi nhóm LLM của Kuaishou. Hiện tại, nó chỉ khả dụng theo lời mời để thử nghiệm trên ứng dụng Kuaiying, một ứng dụng quay và chỉnh sửa video của Kuaishou.

Nhiều người đam mê AI đã chia sẻ những video sáng tạo của họ từ Kling trên X. Mô hình này tạo ra video với độ dài tối đa hai phút ở chất lượng 30 khung hình/giây. Mặt khác, Sora cho đến nay chỉ có khả năng tạo video dài một phút. Dựa trên các mẫu được đăng trên X, video do Kling tạo ra dường như mô phỏng chính xác các thuộc tính vật lý của thế giới thực.

Cần lưu ý rằng Kling không phải là mô hình tạo video duy nhất của Trung Quốc. Vào tháng 4, Vidu AI, một mô hình tạo video có khả năng tạo video 16 giây ở 1080p đã được phát hành tại Trung Quốc. Kling được cho là dựa trên kiến trúc Diffusion Transformer và có thể chuyển đổi các mô tả bằng văn bản thành hình ảnh sống động.

Mô hình Kling sử dụng công nghệ tái tạo khuôn mặt và cơ thể 3D tiên tiến được hỗ trợ bởi công nghệ độc quyền của công ty là 3D VAE, cho phép người dùng tạo video ở nhiều tỷ lệ khung hình khác nhau. Điều này có thể thực hiện được thông qua việc đào tạo với độ phân giải thay đổi, cho phép biểu cảm đầy đủ và chuyển động chân tay từ một bức ảnh toàn thân duy nhất.

Có vẻ như Trung Quốc đang phát triển nhanh chóng các mô hình AI và Kling dường như là minh chứng cho sự phát triển nhanh chóng đó. Có vẻ như Sora của nhà phát triển ChatGPT sẽ phải đối mặt với sự cạnh tranh gay gắt tại Trung Quốc.

Tham khảo thêm: