Se suele sumar todo a la hora de decir caracteristicas, es decir tendrías 4 gigas, y 16 cores (cara cpu lleva 4 cores), pero ten en cuenta que no equivale a una unica maquina con 4 gigas y 16 cores, la comunicación por red es sumamente lente (varias ordenes de magnitud) comparado con la comunicacion en la misma placa
En estos casos se suele usar open-mpi para la programación concurrente.
Si buscas un poco, verás que hay unos cuantos proyectos para fines educativos usando rbpi, que obviamente no van a tener la potencia de un cluster de verdad (ni lo pretenden), pero para aprender y trastear es mucho mas barato, xd