Wednesday, December 4, 2013

Làm sao các thông tin có ích (news, musics, movies,...) chủ động đến với 1 nguời cần nó ?



Kết quả ban đầu khi đáng từ film để tìm các từ liên quan (unsupervised training ):
Enter word or sentence (EXIT to break): movie
 Word       Cosine distance
------------------------------------------------------------------------
                                              film 0.726205
                                            movies 0.724130
                                             films 0.704162
                                            remake 0.646792
                                            batman 0.640161
                                    blaxploitation 0.629710
                                            gojira 0.620710
                                          animated 0.615535
                                           cartoon 0.611009
                                              toho 0.606068
                                        highlander 0.605127
                                             kaiju 0.604210
                                          godzilla 0.596378
                                          starring 0.592826
                                        soundtrack 0.58806



trờ về quá khứ tí, cách đây 6 năm, vào những năm 2007, bị ám ảnh bởi mô tả về cách các hàm vận động (functor) giữa các hệ thống do thầy Peter (http://peteg.org/),  thầy huớng dẫn của mình đề cập.
Thực tế đến giờ thắc mắc vì khá trừu tuợng. Lập ra cái blog http://activefunctor.blogspot.com/ để viết ra cho nó hại não tí.

Cùng thời gian này, 1 số các open source về big data (cụ thể là Hadoop - Map Reduce) bắt đầu hình thành sau khi Google publish cái paper này


Tóm lại, thông tin ở dạng phi cấu trúc dạng text/photo (non-structure) thì rất nhiều và đa dạng. Sự phổ biến của social media và mobile apps làm nó số luợng tăng rất nhanh.
Lịch sử đã nói rằng, có cầu thì sẽ có cung. Sự ra đời của các framework về big data , text analysis để giải quyết các vần đề trên là tất yếu.

Hôm nay, đọc vài bài về deep learning
http://gigaom.com/2013/08/16/were-on-the-cusp-of-deep-learning-for-the-masses-you-can-thank-google-later/
http://venturebeat.com/2012/11/25/deep-learning/
http://gigaom.com/2013/11/01/the-gigaom-guide-to-deep-learning-whos-doing-it-and-why-it-matters/

Nếu cho có robot  crawler đi index các thông tin trên facebook thì sao ?

Xem bài post này sẽ rõ, ít nhất mình đã nghĩ ra từ năm 2011