Monthly Archives: juillet 2015

PySpark et Docker : premiers pas

Au cours de mon stage chez Zenika, j’ai pu découvrir de nombreuses nouvelles technologies. L’une d’entre elles fait beaucoup de bruit dans le domaine du Big Data et du Machine Learning. Je veux bien sur parler ici de Spark. Je vais vous présenter rapidement l’outil et vous proposer de lancer un traitement simple en Python à l’aide de PySpark.

Premiers pas avec PySpark sur Docker

spacer