pytorch · vijayabhaskar-ev · Apr 13, 2025 · Apr 15, 2025 · Apr 17, 2025 · soulitzer
diff --git a/test/test_autograd.py b/test/test_autograd.py
@@ -11339,12 +11339,17 @@ def fn():
 # Generic device type autograd tests.
 class TestAutogradDeviceType(TestCase):
     def test_min_max_median_backprops_to_all_values(self, device):
-        for f in [torch.min, torch.max, torch.median, torch.nanmedian]:
+        amin_ = lambda x: torch.aminmax(x)[0]
+        amax_ = lambda x: torch.aminmax(x)[1]
+
+        for f in [torch.min, torch.max, torch.median, torch.nanmedian, amin_, amax_]:
             x1 = torch.tensor(
                 [1.0, 0.0, 1.0, 0.0, 1.0, 0.0], device=device, requires_grad=True
             )
             x2 = torch.tensor(
-                [float("nan"), float("nan"), float("nan")], requires_grad=True
+                [float("nan"), float("nan"), float("nan")],
+                device=device,
+                requires_grad=True,
             )
             for x in [x1, x2]:
                 y = f(x)

@@ -1201,6 +1201,11 @@
   self: scale_grad_by_count(restore_reduced_dims(grad, dim, keepdim), restore_reduced_dims(result, dim, keepdim) == self, dim)
   result: amaxamin_jvp(self_p, self_t, result, dim, keepdim)
 
+- name: aminmax(Tensor self, *, int? dim=None, bool keepdim=False) -> (Tensor min, Tensor max)
+  self: aminmax_backward(self, dim, keepdim, grad_min, grad_max, min, max)
+  min: 'amaxamin_jvp(self_p, self_t, min, dim.has_value() ? IntArrayRef{dim.value()} : IntArrayRef{}, keepdim)'
+  max: 'amaxamin_jvp(self_p, self_t, max, dim.has_value() ? IntArrayRef{dim.value()} : IntArrayRef{}, keepdim)'
+
 - name: mm(Tensor self, Tensor mat2) -> Tensor
   self: mm_mat1_backward(grad, mat2, self.sym_sizes(), self.sym_strides(), self.layout(), 1)
   mat2: mm_mat2_backward(grad, self, mat2.sym_sizes(), mat2.sym_strides(), mat2.layout(), 1)

@@ -218,6 +218,45 @@ Tensor amaxamin_jvp(
   return at::where(mask, dx, 0.).sum(dim, keepdim) / mask.sum(dim, keepdim);
 }
 
+Tensor aminmax_backward(
+    const Tensor& self,
+    c10::optional<int64_t> dim,
+    bool keepdim,
+    const Tensor& grad_min,
+    const Tensor& grad_max,
+    const Tensor& min,
+    const Tensor& max) {
+  auto dims = dim.has_value() ? IntArrayRef{*dim} : IntArrayRef{};
+
+  auto min_reduced = restore_reduced_dims(min, dims, keepdim);
+  auto max_reduced = restore_reduced_dims(max, dims, keepdim);
+
+  auto min_mask =
+      at::isnan(min).all().item<bool>() ? self.isnan() : self == min_reduced;
+  auto max_mask =
+      at::isnan(max).all().item<bool>() ? self.isnan() : self == max_reduced;
+
+  Tensor result;
+  if (grad_min.defined()) {
+    result = scale_grad_by_count(grad_min, min_mask, dims);
+
+    if (grad_max.defined()) {
+      auto grad_max_result = scale_grad_by_count(grad_max, max_mask, dims);
+      if (!areAnyTensorSubclassLike({result, grad_max_result})) {
+        result.add_(grad_max_result);
+      } else {
+        result = result + grad_max_result;
+      }
+    }
+  } else if (grad_max.defined()) {
+    result = scale_grad_by_count(grad_max, max_mask, dims);
+  } else {
+    result = at::zeros_symint(self.sym_sizes(), self.options());
+  }
+
+  return result;
+}
+
 std::tuple<Tensor, Tensor> _euclidean_dist_backward(
     const Tensor& grad,
     const Tensor& x1,

@@ -816,6 +816,14 @@ Tensor amaxamin_jvp(
     const Tensor& result,
     IntArrayRef dim,
     bool keepdim);
+Tensor aminmax_backward(
+    const at::Tensor& self,
+    c10::optional<int64_t> dim,
+    bool keepdim,
+    const at::Tensor& grad_min,
+    const at::Tensor& grad_max,
+    const at::Tensor& min,
+    const at::Tensor& max);
 std::tuple<Tensor, Tensor, Tensor> layer_norm_double_backward(
     const Tensor& input,
     const std::optional<Tensor>& gamma,

@@ -14647,7 +14647,7 @@ def sample_inputs_alias_copy(op_info, device, dtype, requires_grad, **kwargs):
            dtypes=all_types_and(torch.bool, torch.float16, torch.bfloat16),
            dtypesIfHpu=custom_types(torch.float32, torch.bfloat16, torch.int32, torch.int8),
            decorators=(onlyNativeDeviceTypes,),
-           supports_autograd=False,
+           supports_autograd=True,
            sample_inputs_func=sample_inputs_aminmax,
            error_inputs_func=error_inputs_aminmax_amax_amin),
     OpInfo('as_strided',