instead of int64 for some inputs Returns: WhisperDecoderInputs: dummy inputs for decoder é