Lo de los flancos de reloj sólo es aplicable a peticiones a la RAM. El procesador va a una frecuencia determinada, pero el bus de datos que va a la RAM va a otra frecuencia mucho menor, y las peticiones del procesador a la RAM se sincronizan con esa frecuencia.
Lo de varias instrucciones ya han explicado lo que es superescalar, es como tener varios procesadores en un núcleo. (no es exactamente así, ya que lo que tienes son diferentes ALUs y unidades de control entre otras cosas, además de diferentes técnicas de sincronización, pero como símil se entiende)
No puedo explicar mucho más porque no suelo leer del tema. Sólo sé lo que estudié hace mucho en Estructura de computadores y unos pocos textos que leí que además se referían a procesadores RISC
Lo de operaciones creo recordar que es distinto de instrucciones. Por ejemplo una operacion puede estár comuesta de varias intrucciones, ya que si por ejemplo quieres sumar dos datos, puedes necesitar de uno o dos accesos a memoria (que serían una o dos instrucciones, depende mucho de la arquitectura) y otra para sumarlo.
Es decir que una operación necesitaría de dos instrucciones.