Με περισσότερους από 950 εκατομμύρια χρήστες, ο όγκος των δεδομένων που συλλέγει καθημερινά το Facebook είναι υπερβολικά μεγάλος. Απλά φανταστείτε το, κάθε φορά που κάνετε like, ανοίγετε μια ειδοποίηση, ανεβάζετε μια φωτογραφία ή επισκέπτεστε ένα group, δημιουργείτε δεδομένα τα οποία πηγαίνουν κατευθείαν στην εταιρεία.
Αν το πολλαπλασιάσετε αυτό επί 950 εκατομμύρια χρήστες, οι οποίοι περνούν κατά μέσο όρο 6.5 ώρες κάθε μήνα στο Facebook, καταλαβαίνετε για τι όγκο δεδομένων μιλάμε.
Τα στατιστικά χρήσης μάλιστα που έδωσε στη δημοσιότητα το κοινωνικό δίκτυο την Τετάρτη μιλούν από μόνα τους. Σύμφωνα με αυτά, κάθε μέρα οι χρήστες του κάνουν 2.7 δισεκατομμύρια likes, μοιράζονται 2.5 δισεκατομμύρια status, posts, φωτογραφίες, video και σχόλια ενώ κάθε μέρα ανεβάζουν στο Facebook 300 εκατομμύρια φωτογραφίες.
Όλα αυτά έχουν σαν αποτέλεσμα την δημιουργία περισσότερων από 500 terrabyte δεδομένων κάθε ημέρα και την πραγματοποίηση 70.000 queries. Όλα αυτά αναλύονται μέσω του Hive, της ψηφιακής γλώσσας εξέτασης του Facebook σε ρυθμό 105 terrabyte κάθε μισή ώρα.
«Αν δεν εκμεταλλεύεσαι τα πολλά δεδομένα» είπε ο Jay Parikh, Αντιπρόεδρος υποδομών του Facebook, «τότε δεν έχεις πολλά δεδομένα, έχεις απλά ένα σωρό δεδομένων. Είπε ακόμα πως η εταιρεία μονίμως ψάχνει τρόπους για το πώς μπορεί να αναλύσει και να ερμηνεύσει τα δεδομένα αυτά για να συμπληρώσει πως το Facebook μπορεί να μεγαλώνει γρήγορα, αλλά όλοι οι υπόλοιποι μεγαλώνουν γρηγορότερα.