Công cụ tạo video mới của TikTok được đánh giá cao hơn Veo 3

15:00 | 20/06/2025

ByteDance, tập đoàn đứng sau TikTok và Douyin, vừa chính thức công bố Seedance 1.0, công cụ AI mới có khả năng chuyển văn bản và hình ảnh thành video.

Seedance 1.0 được giới thiệu là nền tảng tạo video thông minh, có thể chuyển đổi các chỉ dẫn đơn giản thành video chất lượng cao mà không cần đến kịch bản chi tiết hoặc câu lệnh kỹ thuật phức tạp. Điểm đáng chú ý của công cụ là khả năng xử lý mượt mà nhiều cảnh quay, kết hợp các góc máy linh hoạt, đồng thời duy trì tính nhất quán của nhân vật xuyên suốt toàn bộ video.

Trong báo cáo kỹ thuật do ByteDance công bố, công nghệ cốt lõi của Seedance 1.0 nằm ở khả năng mã hóa không gian – thời gian trong video. Cụ thể, các yếu tố vị trí và dòng thời gian được phân tách để AI có thể học cách tái tạo chuyển động một cách logic và trực quan từ cả hình ảnh tĩnh lẫn văn bản.

“Chúng tôi phát triển một phương pháp đặc biệt giúp mô hình hiểu được bối cảnh và chuỗi hành động trong video. Nhờ đó, Seedance 1.0 có thể tự tạo ra các đoạn phim có nhiều cảnh quay mà không mất đi tính liền mạch”, đại diện ByteDance cho biết.

Một video do Seedance 1.0 tạo ra từ văn bản mô tả. Video: ByteDance

Ngay sau khi công bố, Seedance 1.0 đã được nền tảng Artificial Analysis xếp trên các đối thủ lớn như Veo 3 của Google, Sora của OpenAI và Kling 2.0 do Kuaishou phát triển. Công cụ thể hiện hiệu suất vượt trội ở cả hai tác vụ gồm tạo video từ văn bản và từ hình ảnh.

Điểm mạnh nổi bật của Seedance 1.0 là khả năng nắm bắt ý tưởng đầu vào của người dùng, chất lượng hình ảnh sắc nét, chuyển động nhân vật tự nhiên và cách dẫn cảnh thông minh. Đặc biệt, hệ thống chỉ mất 41 giây để hoàn tất một đoạn video độ phân giải Full HD dài 5 giây, tốc độ được xem là nhanh hàng đầu trong nhóm công cụ tạo video AI hiện nay.

Tuy nhiên, so với một số đối thủ như Veo 3, Seedance 1.0 vẫn có điểm trừ. Công cụ hiện chưa hỗ trợ tự động tạo âm thanh nền hoặc lời thoại, một tính năng đang dần trở thành tiêu chuẩn mới trong lĩnh vực video AI. Thêm vào đó, thời lượng video tối đa mới dừng ở mức 5 giây, thấp hơn mức 8 giây của Google Veo.

ByteDance khẳng định Seedance 1.0 được huấn luyện trên kho dữ liệu video quy mô lớn, thu thập từ các nguồn công khai có giấy phép và được lọc kỹ nhằm loại bỏ nội dung vi phạm, bạo lực hoặc nhạy cảm. Dù không nêu đích danh, giới phân tích cho rằng phần lớn dữ liệu đến từ chính hai nền tảng video đình đám TikTok và Douyin do ByteDance vận hành.

Quá trình đào tạo mô hình được thực hiện theo nhiều giai đoạn, từ học các đặc điểm thị giác cơ bản trong ảnh và video, đến nắm bắt các kỹ thuật chuyển cảnh theo phong cách, nhịp độ khác nhau. Đội ngũ kỹ sư của ByteDance cũng tham gia chọn lọc video chất lượng cao để mô hình bắt chước học theo.

Ở giai đoạn sau, Seedance 1.0 được yêu cầu tạo ra nhiều video cùng lúc dựa trên một chỉ dẫn cụ thể, sau đó tự đánh giá và chọn ra phiên bản tối ưu nhất để tiếp tục cải thiện trong vòng lặp huấn luyện.

ByteDance cho biết đang lên kế hoạch phát hành Seedance 1.0 đến cả người dùng phổ thông lẫn các nhà sáng tạo chuyên nghiệp, nhằm phục vụ nhu cầu sản xuất video quảng cáo, nội dung ngắn cho mạng xã hội hoặc truyền thông số.

Trước đó, công ty từng phát triển một số công cụ AI tạo hình và video như OmniHuman (tạo người ảo), Goku (mô phỏng chuyển động) hay Jimeng AI (hỗ trợ sản xuất video ngắn). Tuy nhiên, đây là lần đầu tiên ByteDance ra mắt một sản phẩm hoàn chỉnh, được đánh giá có thể cạnh tranh sòng phẳng với các “ông lớn” như Google hay OpenAI.

Sự xuất hiện của Seedance 1.0 cho thấy rõ tham vọng của ByteDance không chỉ dừng ở nền tảng mạng xã hội, mà đang mở rộng mạnh mẽ sang hệ sinh thái AI sáng tạo nội dung – lĩnh vực được dự báo sẽ thay đổi hoàn toàn cách con người sản xuất video trong tương lai.

Thái Sơn

URL: https://vietpress.vn/cong-cu-tao-video-moi-cua-tiktok-duoc-danh-gia-cao-hon-veo-3-d97424.html