13

Twitter, Google, Amazon, del.icio.us itd. dają ci dużo danych do zabawy, wszystko za darmo. Dostępnych jest również wiele danych tekstowych dzięki inicjatywom takim jak Project Gutenberg. A to, jak się wydaje, to tylko wierzchołek góry lodowej.Jakie są sposoby na dobrą zabawę przy dużej ilości danych? (tj. Twitter, del.icio.us itp. API)

Zastanawiam się, w jaki sposób można wykorzystać te dane dla zabawy. Jestem studentem informatyki pierwszego roku, więc nie mam wiedzy o statystykach, uczeniu maszynowym, filtrowaniu grupowym itd. Moje zainteresowanie tym obszarem dostarczyła książka Tany Segaran, książka Programowanie kolektywnej inteligencji, a teraz chcę wziąć głębsze spojrzenie na to, co możesz zrobić z danymi. Nie wiem, od czego zacząć. Jakieś pomysły?

Zastanawiam się również, czy powinienem pójść i kupić coś takiego, jak Paradygmaty programowania sztucznej inteligencji. Czy warto podróżować przez miasto?

+0

Amazon sprzedaje książki :) dlaczego podróżujesz po mieście? –

+0

Nie sprzedaje książek w Indiach :( –

Odpowiedz

6

Wypalanie książek w różnych stylach od Guttenberga poprzez generator łańcuchów Markowa - jest jeden w Perlu here, aby zacząć grę.

+0

Pokonaj mnie, maszyny Markov to świetna zabawa :) –

+0

Opublikuj wyniki na koncie Twitter za pośrednictwem interfejsu API i zobacz, ilu obserwatorów możesz uzyskać na podstawie swoich tweetów generowanych przez urządzenie. –

+1

Podoba mi się! Ale większość dupków zdaje się być słabo zaprogramowanymi sztucznymi inteligencjami. Mam poważne wątpliwości co do ich zdolności do zaliczenia testu Turinga. –

3

Wizualizacje, zrób to, udostępnij je.

0

Możesz tworzyć puzzle takie jak gry w kata. Lub mashup lub wypróbuj rury Yahoo, aby dołączyć do informacji.

1

Możesz wykorzystać niektóre z tych danych do zarabiania pieniędzy (jeśli jesteś naprawdę dobry!) http://www.netflixprize.com/ Firma Netflix udostępniła anonimowy zbiór danych i prosi o lepsze algorytmy do przewidywania wyborów klientów.

+0

Tak, zamierzałem to zasugerować. Pracuję nad tym teraz. –

0

Przewiduj przyszłe trendy na giełdzie z danych. Zysk!

+0

Łatwiej powiedzieć, to zrobić. – Cerin

1

Jeśli znasz język w Pythonie, spróbuj odtworzyć go za pomocą nltk. Ma mnóstwo bibliotek do eksploracji tekstu, a nawet ogólnie do uczenia maszynowego. Spróbuj przejść przez nltk book.