Big Data NoSQL

PySpark et Docker : premiers pas

Au cours de mon stage chez Zenika, j’ai pu découvrir de nombreuses nouvelles technologies. L’une d’entre elles fait beaucoup de bruit dans le domaine du Big Data et du Machine Learning. Je veux bien sur parler ici de Spark. Je vais vous présenter rapidement l’outil et vous proposer de lancer un traitement simple en Python à l’aide de PySpark.

Premiers pas avec PySpark sur Docker

spacer

Gestion des objets « embedded » dans MongoDB en Java

Lors d’un petit projet personnel récent, j’ai souhaité utiliser le driver Java de MongoDB. Afin de rendre le traitement plus simple à utiliser, je surcharge les différentes méthodes de la classe DBObject avec mes classes de données afin de leur permettre d’être instanciées très rapidement. Cependant, lors de la réalisation des tests unitaires, je me suis rendu compte que les objets inclus dans les documents de la base n’étaient pas récupérés. Voyons pourquoi.

javamongodb

spacer