Pytorch backend: Model is run in no_grad mode even with INFERENCE_MODE=false #7974

hakanardo · 2025-01-28T08:57:15Z

When INFERENCE_MODE is set to false, the model still runs in no_grad mode. Is that intentional? This prevents the serving of models that requires gradients at inference time, such as differential rendering for example. Can we instead use the default mode when INFERENCE_MODE=false (as is implemented the pull-request: triton-inference-server/pytorch_backend#146) or would it be preferable to add additional parameters to enable the default mode?

Thanx!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Pytorch backend: Model is run in no_grad mode even with INFERENCE_MODE=false #7974

Pytorch backend: Model is run in no_grad mode even with INFERENCE_MODE=false #7974

hakanardo commented Jan 28, 2025

Pytorch backend: Model is run in no_grad mode even with INFERENCE_MODE=false #7974

Pytorch backend: Model is run in no_grad mode even with INFERENCE_MODE=false #7974

Comments

hakanardo commented Jan 28, 2025