“Was sagen unsere Smartphone-Verwendungsdaten eigentlich über uns aus?” fragt die Nokia Mobile Data Challenge (NMDC). Können anhand von mobilen Sensordaten Orte anhand ihrer Semantik (z.B. „Arbeitsplatz“, „Daheim“, „Restaurant oder Bar“ etc.) unterschieden werden? Ein Know-Center Team bestehend aus vier ForscherInnen aus drei Teams (Knowledge Context, Knowledge Evolution, Knowledge Discovery) hat sich an die Beantwortung dieser Frage gemacht.
Wir sind stolz darauf, dass das Know-Center Team es unter die Top 25% der hoch-kompetitiven NMDC geschafft hat, mit einer Genauigkeit von zwischen 83% und 96%, je nachdem welche Features verwendet, und welche semantischen Orte identifiziert wurden. Zur automatischen Identifikation der semantische Orte standen dem Team keine absoluten Ortsinformationen wie z.B. GPS Koordinaten zur Verfügung, sondern lediglich relative unique Place IDs sowie zusätzliche mobile Sensordaten wie zum Beispiel Bewegungsdaten von Beschleunigungssensoren, anonymisierte WLAN Zugriffspunkte, etc. Die verfügbaren Daten wurden vom Know-Center Team basierend auf State-of-the-Art Forschungsergebnissen bzgl. des typischen menschlichen Wochen- und Tagesrhythmus auf aufwändige Weise aufbereitet. Im Speziellen wurden für die NMDC Challenge fünf Feature-Gruppen entworfen, die jeweils unterschiedliche Merkmale abbilden: Tagesrhythmus und Wochenrhythmus von Smartphone-Benutzern, bei der Bewegung des Smartphones gemessene Beschleunigungsdaten, Batterieladestatus, und WLAN Information. Auf diesen Feature-Gruppen wurde ein Random Forest Algorithmus trainiert und auf dem NMDC Trainingsset evaluiert. Hier wurden hohe Genauigkeiten zwischen 83% und 96% bei einer 10-fachen Cross-Validation erzielt, abhängig davon, welche Features verwendet wurden, und ob ein Klassifikator für alle semantischen Orte trainiert wurde, oder ob spezielle Klassifikatoren für unterschiedliche semantische Orte trainiert wurden, wodurch eine höhere Genauigkeit erreicht wurde.
“A smartphone can say many things about us, but what can be revealed through our data usage?” the Nokia Mobile Data Challenge (NMDC) asks. A Know-Center team of four researchers from three teams (Knowledge Context, Knowledge Evolution, Knowledge Discovery) took up the challenge to identify semantic place labels like “Workplace”, “At Home”, “Restaurant or Bar” from mobile sensor data. We are proud to announce that the Know-Center team landed amongst the top 25% in the highly competitive NMDC, with accuracies between 83% and 96% depending on used features and identified semantic place!
In order to automatically predict such semantic place labels, the team was given no absolute location information like for instance GPS, but had relative unique place IDs and additional mobile sensor data like motion data from an accelerometer, WLAN access points (again, anonymised) etc. available. Using extensive data preprocessing based on weekly and daily patterns in human behaviour as known from prior research, mobile sensor data were preprocessed and five feature groups (daily patterns, weekly patterns, accelerometer data, battery charging information, WLAN information) were designed. A random forest algorithm was trained and evaluated on the NMDC training set, and accuracies between 83% and 96% using a 10-fold cross-validation were achieved. The results depend on the used features and whether one classifier model was trained for all semantic place labels (lower accuracy) or specialized classifier models were trained for single semantic place labels (higher accuracy).