Monday, October 22, 2018

Video Ecosystem và các ý tưởng xây dựng hệ thống Big Data kế tiếp chuyên cho video



Sự thật: YouTube có hơn 300 giờ video được tải lên mỗi phút. Và  đó là YouTube ! Nếu chúng ta thêm tất cả các video khác từ toàn bộ Internet, chúng ta thậm chí sẽ không biết bắt đầu từ đâu bằng các con số nào.
Tuy nhiên, những con số thậm chí còn lớn hơn thực sự ẩn trong công ty tư nhân như từ các nguồn như đài truyền hình, công ty truyền thông, CCTV, GoPros, bodycams, thiết bị thông minh, v.v. Thế giớ chúng ta đang sống đang tạo ra video với tốc độ và quy mô chưa từng có.

Điều này đưa chúng ta đến khái niệm Video Big Data. Điều này sẽ tạo ra khả năng trích xuất dữ liệu video và hiểu được nó. Nhưng có rất nhiều thông tin được nhúng bên trong các video đang chờ để phát hiện ra, đó là một mỏ vàng với bất kỳ công ty nào !

Khái niệm "Video Big Data" sẽ lớn hơn rất nhiều khái niệm "Big Data" cổ điển của 10 năm về trước (vốn chỉ bao gồm phổ biến chỉ có văn bản text và hình ảnh)
Vì sao Video Big Data sẽ phát triển trong nhiều năm tới ?
"Video First" là khái niệm phổ biến gần đây của các nhà sản xuất content, qua khá nhiều các startups cũng như công ty đang triển khai sản phẩm. Ngoài YouTube và Facebook, Instagram , các ứng dụng OTT như Netflix, FPT Play, ...
Điều này tất yếu dẫn đến 5 xu hướng các công ty công nghệ làm những mảng khác về hệ sinh thái cho video 


1) Streaming Cloud: làm về hạ tầng Live Streaming, Video Hosting, ... 


2) Video Ad Platform: 

3) Video Player
4) Video Content Platform
5) Video Analytics Platform
Vì sao Video Big Data lại phức tạp ?
  • Có rất nhiều yếu tố bên trong video (lời nói, văn bản, khuôn mặt, đối tượng, v.v.)
  • Video về bản chất là tập hợp image liên tục (29 frames/seconds), nó không phải là tĩnh.
  • Rất khó để trích xuất các phần tử khác nhau của dữ liệu video.
  • Mỗi phần tử video yêu cầu kỹ thuật trích xuất dữ liệu khác nhau.
  • Rất khó để hiểu được dữ liệu video vì bản chất không có cấu trúc của nó.
  • Tốn kém chi phí để trích xuất dữ liệu ở quy mô lớn vì cần nhiều card đồ hoạ và computing resources
Chúng ta tạo ra giá  trị gì từ những thông tin trong video ?

Thông tin phổ biến trong video bao gồm
  • Lời nói 
  • Văn bản 
  • Đối tượng 
  • Chuyển động (toàn bộ hoặc khu vực cụ thể của khung hình video)
  • Khuôn mặt những nhân vật (xác định User ID từ video)
  • Cảm xúc (lên đến 8 cảm xúc chính)
  • Nội dung xúc phạm (brand-safe)
Việc có cấu trúc hoá và index dữ liệu trong video sẽ giúp chúng ta đưa về năng lực hiểu rõ hơn nhiều thông tin chi tiết ở mức độ mà dữ liệu hình ảnh và text chưa cung cấp đủ
Video demo ứng dụng AI cho việc phân tích dữ liệu video 



Kết luận:

Lĩnh vực Video Big Data mới nổi lên. Nếu không có sự tiến bộ trong nhiều lĩnh vực Trí tuệ nhân tạo trong nhiều lĩnh vực (Speech Recognition, Computer Vision, Face Detection,Text Analytics v.v.,
Video Big Data thậm chí sẽ không tồn tại khi cần các lĩnh vực trên chưa phát triển.

Với tốc độ mà chúng ta đang sản xuất video, cùng với khả năng của chúng ta trích xuất dữ liệu video bằng cách sử dụng A.I sẽ tạo ra các khả năng lợi thế cạnh tranh là rất lớn.
Vậy lý do gì chúng ta sẽ bỏ qua Video Big Data trong danh mục các công nghệ cần đầu tư ?