Tienes que entrenar un modelo para crear un checkpoint con imágenes del pokémon en cuestión que quieres o entrenar un LORA con más de lo mismo, varias imágenes del pokémon en cuestión, luego ya puedes poner prompts o usar imágenes como referencia una vez que tienes ya un modelo basado en lo que quieres.
También puedes entrenar un modelo o mirar si hay alguno, basado en dibujo a lápiz, en plan boceto, y luego le pasas el input de la imagen y ya lo tienes.
La gente piensa que usar IA es pedirle un prompt y ya, muchas veces hay que customizarse los modelos y mezclarlos, etc... supongo que en un futuro entrenar modelos será cuestión de segundos, pero actualmente vas a requerir de usar google colab si no tienes una GPU decente para entrenar, para entrenar se necesita bastante VRAM, nada que ver con generar imágenes, hasta yo puedo generar imágenes con mi GTX 970 que tiene núcleos cuda.