Wednesday, May 17, 2023

Dataism - Sự khác biệt giữa Social graph và User Interest graph

Bản chất con người là sinh vật xã hội. Mặc dù một số người hòa đồng hơn những người khác, nhưng ngay cả những người kém năng động hơn cũng tìm kiếm các phương tiện để kết nối và kết nối. Trong thời đại này, internet là nguồn mạng xã hội phổ biến nhất, với vô số ứng dụng và nền tảng mạng xã hội. Như vậy, mọi người không còn cần phải gặp mặt trực tiếp hoặc đưa ra những cái bắt tay để giao tiếp. Chẳng hạn, Facebook, trang mạng xã hội lớn nhất toàn cầu đã vượt mốc 1 tỷ người dùng. Biểu đồ xã hội và biểu đồ sở thích là hai khía cạnh hình thành nên trải nghiệm của mạng xã hội. Mặc dù đôi khi được sử dụng như từ đồng nghĩa, cả hai đều có sự khác biệt.


Social Graph (đồ thị mạng xã hội) là gì?

Đây là cách thể hiện cho thấy những điều cụ thể mà một cá nhân thu hút sự quan tâm dựa trên khía cạnh mà sở thích của mọi người tạo thành một phần chính trong con người họ.

Vì Social Graph tạo thành một phần danh tính của một cá nhân, nên chúng có thể được sử dụng làm chỉ báo về sở thích, chẳng hạn như những gì một cá nhân có thể muốn mua, nơi họ muốn sống, người mà họ muốn bỏ phiếu, tương tác với gặp gỡ, v.v.

Phổ biến với các trang mạng xã hội như LinkedIn và Facebook, nó giúp duy trì và vạch ra các mối quan hệ xã hội. Nó cũng dựa trên lý thuyết rằng người tiêu dùng có thể thích những thứ mà bạn bè thích.

Social Graph hình thành các mô hình kinh doanh và doanh thu, như thường thấy trên Facebook. Do đó, các nhà quảng cáo có thể cho chúng tôi thông tin được cá nhân hóa để phân phối các quảng cáo hấp dẫn và có ý nghĩa.

User Interest Graph (đồ thị sở thích người dùng) là gì?

Đây là một đại diện trực tuyến về những thứ riêng biệt mà một người quan tâm. Chúng được sử dụng để tạo mạng lưới sở thích của một người trên các trang truyền thông xã hội như Facebook bằng cách tổ chức xung quanh sở thích của một người. Amazon cũng đã khai thác biểu đồ sở thích thông qua công cụ đề xuất, theo đó công ty cho người tiêu dùng biết những khách hàng khác có lịch sử mua hàng tương tự đã mua gì.

Dựa trên giao điểm giữa nội dung trang web và biểu đồ sở thích, điều này cung cấp phương tiện cá nhân hóa trang web. Tuy nhiên, một biểu đồ sở thích chính xác phải tính đến các sở thích đã khai báo chẳng hạn như sở thích, ảnh và nhận xét được gắn thẻ cũng như lượt thích.

Tầm quan trọng của User Interest Graph
  • Kết nối những người có cùng sở thích trong xã hội hoặc mạng xã hội
  • Nó rất quan trọng trong marketing vì nó cung cấp khả năng phân tích tập khách hàng (audience analytics) 
  • Nó hỗ trợ lập hồ sơ hành vi trong marketing bằng cách nhắm mục tiêu người tiêu dùng dựa trên sở thích
  • Giúp phát triển sản phẩm thông qua việc sử dụng lợi ích của khách hàng

Điểm tương đồng giữa Biểu đồ xã hội và Biểu đồ sở thích
  • Cả hai định hình lại trải nghiệm của mạng xã hội và thị trường hàng hoá tiêu dùng
Sự khác biệt giữa Biểu đồ xã hội và Biểu đồ sở thích


Social Graph đề cập đến một biểu diễn cho thấy những điều cụ thể mà một cá nhân thu hút sự quan tâm dựa trên khía cạnh mà sở thích của mọi người tạo thành một phần chính trong con người họ. Mặt khác, biểu đồ sở thích đề cập đến một biểu diễn trực tuyến về những thứ riêng biệt mà một người quan tâm.

Trong khi Social Graph dựa trên danh tính thực của một người, User Interest Graph dựa trên những điều mà một người quan tâm.

Bảng so sánh


Tóm tắt về Social graph và Interest graph

Biểu đồ xã hội đề cập đến một biểu diễn cho thấy những điều cụ thể mà một cá nhân thu hút sự quan tâm dựa trên khía cạnh mà sở thích của mọi người tạo thành một phần chính trong con người họ. Mặt khác, biểu đồ sở thích đề cập đến một đại diện trực tuyến về những thứ riêng biệt mà một người quan tâm. Bất chấp sự khác biệt, cả hai đều định hình lại trải nghiệm của các mạng xã hội.


Tuesday, February 15, 2022

Data Engineering Roadmap for beginner

1. Programming Languages

2. Learn Linux


Linux Essentials - Beginner Crash Course (Ubuntu) https://www.youtube.com/watch?v=n_2jPbQornY


3. Learn about Data Structures and Algorithms

DATA STRUCTURES you MUST know https://www.youtube.com/watch?v=sVxBVvlnJsM


4. Learn about Core DBMS (Database Management Systems)

Learn RDBMS in 6 minutes https://www.youtube.com/watch?v=t48TGntrX4s

5. Learn SQL

SQL Tutorial - Full Database Course for Beginners https://www.youtube.com/watch?v=HXV3zeQKqGY


6. Data Exploration Libraries (Pandas — NumPy — Spark)


7. Data Warehousing and Data Lake Concepts
8. Learn about Distributed Computing and Cloud Computing 

Cloud Computing Tutorial for Beginners https://www.youtube.com/watch?v=RWgW-CgdIk0
Distributed Systems | Distributed Computing Explained https://www.youtube.com/watch?v=ajjOEltiZm4

9. Workflow schedulers


Apache Airflow for beginners https://www.youtube.com/watch?v=YWtfU0MQZ_4


10. NoSQL Databases


11. Streaming Systems

Kafka Streams 101: Getting Started https://www.youtube.com/watch?v=y9a3fldlvnI

12. Dashboarding tools14. Data Engineering in the Cloud

AWS Data Engineering Course - Full Course https://www.youtube.com/watch?v=ckQ7d6ca2J0
Google Cloud Platform Full Course https://www.youtube.com/watch?v=IUU6OR8yHCc

15. DevOps (Docker — Kubernetes)


Docker and Kubernetes Tutorial | Full Course [2021] https://www.youtube.com/watch?v=bhBSlnQcq2k

16. System Design

System Design Course for Beginners https://www.youtube.com/watch?v=MbjObHmDbZo
System Design Interview – Step By Step Guide https://www.youtube.com/watch?v=bUHFg8CZFws
System Design Mock Interview: Design Instagram https://www.youtube.com/watch?v=VJpfO6KdyWE

This series touches key areas in system design, which are used to design real world systems and interview questions.

  1. Load balancing
  2. Message Passing
  3. Microservice architecture
  4. NoSQL databases
  5. Distributed Systems

https://www.youtube.com/playlist?list=PLMCXHnjXnTnvo6alSjVkgxV-VH6EPyvoX

Wednesday, February 2, 2022

[Video Lecture] Học máy thống kê và khoa học phân tích dữ liệu lớn

 


Bài giảng đại chúng “Học máy thống kê và khoa học phân tích dữ liệu lớn” Phần 1


Bài giảng đại chúng “Học máy thống kê và khoa học phân tích dữ liệu lớn” phần 2