csarofeen
diff --git a/‎aten/src/ATen/native/transformers/cuda/attention.cu
Lines changed: 4 additions & 3 deletions b/‎aten/src/ATen/native/transformers/cuda/attention.cu
Lines changed: 4 additions & 3 deletions
diff --git a/‎c10/core/SymInt.cpp
Lines changed: 0 additions & 15 deletions b/‎c10/core/SymInt.cpp
Lines changed: 0 additions & 15 deletions
diff --git a/‎c10/core/SymInt.h
Lines changed: 0 additions & 3 deletions b/‎c10/core/SymInt.h
Lines changed: 0 additions & 3 deletions
diff --git a/‎c10/core/SymIntNodeImpl.h
Lines changed: 0 additions & 6 deletions b/‎c10/core/SymIntNodeImpl.h
Lines changed: 0 additions & 6 deletions
diff --git a/‎test/functorch/test_aotdispatch.py
Lines changed: 2 additions & 0 deletions b/‎test/functorch/test_aotdispatch.py
Lines changed: 2 additions & 0 deletions
diff --git a/‎test/test_proxy_tensor.py
Lines changed: 1 addition & 0 deletions b/‎test/test_proxy_tensor.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎tools/autograd/derivatives.yaml
Lines changed: 4 additions & 4 deletions b/‎tools/autograd/derivatives.yaml
Lines changed: 4 additions & 4 deletions
diff --git a/‎torch/_subclasses/fake_tensor.py
Lines changed: 0 additions & 1 deletion b/‎torch/_subclasses/fake_tensor.py
Lines changed: 0 additions & 1 deletion
diff --git a/‎torch/csrc/autograd/FunctionsManual.cpp
Lines changed: 13 additions & 22 deletions b/‎torch/csrc/autograd/FunctionsManual.cpp
Lines changed: 13 additions & 22 deletions
diff --git a/‎torch/csrc/autograd/FunctionsManual.h
Lines changed: 2 additions & 2 deletions b/‎torch/csrc/autograd/FunctionsManual.h
Lines changed: 2 additions & 2 deletions
@@ -16,6 +16,7 @@
 
 #include <c10/cuda/CUDAMathCompat.h>
 
+#include <ATen/native/NonSymbolicBC.h>
 #include <ATen/native/nested/NestedTensorUtils.h>
 #include <ATen/native/nested/NestedTensorTransformerFunctions.h>
 
@@ -367,8 +368,8 @@ __global__ void transform_bias_rescale_qkv_add_padding_kernel(
 }
 
 Tensor collapse_dims_1_and_2(const Tensor& sizes) {
-  auto sizes_dim1 = at::native::narrow_symint(sizes, 1, 0, 1);
-  auto sizes_dim2 = at::native::narrow_symint(sizes, 1, 1, 1);
+  auto sizes_dim1 = at::native::narrow(sizes, 1, 0, 1);
+  auto sizes_dim2 = at::native::narrow(sizes, 1, 1, 1);
 
   return (sizes_dim1 * sizes_dim2).contiguous();
 }
@@ -450,7 +451,7 @@ __host__ std::tuple<Tensor, Tensor, Tensor> transform_bias_rescale_qkv_cuda(
           auto sizes = collapse_dims_1_and_2(nt_qkv->get_nested_size_tensor());
           auto offsets =
               NestedTensor_batch_offsets_from_size_tensor(sizes, sizes.numel());
-          at::native::narrow_symint(offsets, 0, sizes.numel() + 1, sizes.numel())
+          at::native::narrow(offsets, 0, sizes.numel() + 1, sizes.numel())
               .copy_(sizes.reshape({-1}));
           auto metadata = offsets.to(at::Device(kCUDA), at::kInt, true, true);
           const auto offsets_ptr = metadata.data_ptr<int>();
 
@@ -136,21 +136,6 @@ bool SymInt::operator>=(SymInt sci) const {
   return res[0]->ge(res[1])->bool_();
 }
 
-SymInt SymInt::min(SymInt sci) const {
-  if (!is_symbolic() && !sci.is_symbolic()) {
-    return std::min(data_, sci.data_);
-  }
-  auto res = normalize_symints(*this, sci);
-  return SymInt::toSymInt(res[0]->min(res[1]));
-}
-SymInt SymInt::max(SymInt sci) const {
-  if (!is_symbolic() && !sci.is_symbolic()) {
-    return std::max(data_, sci.data_);
-  }
-  auto res = normalize_symints(*this, sci);
-  return SymInt::toSymInt(res[0]->max(res[1]));
-}
-
 void SymInt::operator*=(SymInt sci) {
   *this = *this * sci;
 }
 
@@ -170,9 +170,6 @@ class C10_API SymInt {
   void operator*=(SymInt sci);
   void operator+=(SymInt sci);
 
-  SymInt min(SymInt sci) const;
-  SymInt max(SymInt sci) const;
-
   SymInt operator*(int64_t sci) const;
   bool operator<(int64_t sci) const;
   bool operator==(int64_t sci) const;
 
@@ -63,12 +63,6 @@ class C10_API SymIntNodeImpl : public c10::intrusive_ptr_target {
   virtual SymIntNode ceil() {
     TORCH_CHECK(false, "NYI");
   };
-  virtual SymIntNode min(const SymIntNode& other) {
-    TORCH_CHECK(false, "NYI");
-  };
-  virtual SymIntNode max(const SymIntNode& other) {
-    TORCH_CHECK(false, "NYI");
-  };
   virtual SymIntNode clone() {
     TORCH_CHECK(false, "NYI");
   };
 
@@ -1062,6 +1062,7 @@ def assert_compiler(gm: torch.fx.GraphModule, _):
     xfail('nn.functional.interpolate', 'trilinear'),  # Cannot call sizes() on tensor with symbolic sizes/st...
     xfail('nn.functional.kl_div', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
     xfail('nn.functional.l1_loss', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
+    xfail('nn.functional.linear', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
     xfail('nn.functional.local_response_norm', ''),  # aten.fill.Scalar - couldn't find symbolic meta functio...
     xfail('nn.functional.max_pool1d', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
     xfail('nn.functional.max_pool2d', ''),  # aten.max_pool2d_with_indices_backward.default - couldn't find s...
@@ -1136,6 +1137,7 @@ def assert_compiler(gm: torch.fx.GraphModule, _):
     xfail('special.polygamma', 'special_polygamma_n_0'),  # aten.polygamma.default - couldn't find symbolic ...
     xfail('special.xlog1py', ''),  # aten.special_xlog1py.default - couldn't find symbolic meta function/deco...
     xfail('split', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
+    xfail('squeeze', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
     xfail('std', ''),  # Cannot call numel() on tensor with symbolic sizes/strides
     xfail('std_mean', ''),  # Cannot call numel() on tensor with symbolic sizes/strides
     xfail('stft', ''),  # Cannot call sizes() on tensor with symbolic sizes/strides
 
@@ -1056,6 +1056,7 @@ def f(a, b, c, d, e):
     xfail('argmin', ''),  # aten.argmin.default - couldn't find symbolic meta function/decomposition
     xfail('argsort', ''),  # aten.sort.default - couldn't find symbolic meta function/decomposition
     xfail('argwhere', ''),  # aten.nonzero.default - couldn't find symbolic meta function/decomposition
+    xfail('as_strided_scatter', ''),  # aten.as_strided_scatter.default - couldn't find symbolic meta function/decomposition
     xfail('baddbmm', ''),  # aten.baddbmm.default - couldn't find symbolic meta function/decomposition
     xfail('bernoulli', ''),  # aten.bernoulli.default - couldn't find symbolic meta function/decomposition
     xfail('bucketize', ''),  # aten.bucketize.Tensor - couldn't find symbolic meta function/decomposition
 
@@ -1493,19 +1493,19 @@
   result: auto_element_wise
 
 - name: squeeze(Tensor(a) self) -> Tensor(a)
-  self: unsqueeze_to(grad, self.sym_sizes())
+  self: unsqueeze_to(grad, self.sizes())
   result: auto_linear
 
 - name: squeeze.dim(Tensor(a) self, int dim) -> Tensor(a)
-  self: unsqueeze_to(grad, dim, self.sym_sizes())
+  self: unsqueeze_to(grad, dim, self.sizes())
   result: auto_linear
 
 - name: squeeze_(Tensor(a!) self) -> Tensor(a!)
-  self: unsqueeze_to(grad, self.sym_sizes())
+  self: unsqueeze_to(grad, self.sizes())
   result: auto_linear
 
 - name: squeeze_.dim(Tensor(a!) self, int dim) -> Tensor(a!)
-  self: unsqueeze_to(grad, dim, self.sym_sizes())
+  self: unsqueeze_to(grad, dim, self.sizes())
   result: auto_linear
 
 - name: std.correction(Tensor self, int[1]? dim, *, int? correction, bool keepdim=False) -> Tensor
 
@@ -885,7 +885,6 @@ def wrap(e, device=None):
     def functions_with_cpp_meta_impl_that_support_symint(self):
         return [
             aten.empty_strided.default,
-            aten.as_strided_scatter.default,
             aten.as_strided.default,
             aten.zeros.default,
             aten.detach.default,
 
@@ -848,26 +848,23 @@ Tensor unbind_backward(const variable_list& grads, int64_t dim) {
   return at::stack(grads_tensors, dim);
 }
 
-Tensor unsqueeze_to(const Tensor& self, c10::SymIntArrayRef sym_sizes) {
+Tensor unsqueeze_to(const Tensor& self, IntArrayRef sizes) {
   auto result = self;
 
-  int64_t nDims = sym_sizes.size();
+  int64_t nDims = sizes.size();
   for (const auto dim : c10::irange(nDims)) {
-    if (sym_sizes[dim] == 1) {
+    if (sizes[dim] == 1) {
       result = result.unsqueeze(dim);
     }
   }
   return result;
 }
 
-Tensor unsqueeze_to(
-    const Tensor& self,
-    int64_t dim,
-    c10::SymIntArrayRef sym_sizes) {
-  dim = at::maybe_wrap_dim(dim, sym_sizes.size());
+Tensor unsqueeze_to(const Tensor& self, int64_t dim, IntArrayRef sizes) {
+  dim = at::maybe_wrap_dim(dim, sizes.size());
   // in NumPy it's not an error to unsqueeze a scalar, but we still need to
   // avoided unsqueezing in the backward.
-  if (sym_sizes.size() > 0 && sym_sizes[dim] == 1) {
+  if (sizes.size() > 0 && sizes[dim] == 1) {
     return self.unsqueeze(dim);
   }
   return self;
@@ -2839,27 +2836,21 @@ Tensor as_strided_backward(
 
   // Step (1): create underlying tensor as "storage"
   auto shared_offset =
-      // TODO: symint-ify. Do we need a min() and max() for SymInts?
-      input_geometry.sym_storage_offset().min(sym_storage_offset);
+      std::min(input_geometry.sym_storage_offset(), sym_storage_offset);
   auto inp_effective_offset =
       input_geometry.sym_storage_offset() - shared_offset;
   auto out_effective_offset = sym_storage_offset - shared_offset;
-  auto base_size1 =
-      _min_storage_size(inp_sizes_, inp_strides_, inp_effective_offset);
-  auto base_size2 =
-      _min_storage_size(out_sizes_, out_strides_, out_effective_offset);
-  auto base_size = base_size1.max(base_size2);
-  auto storage = grad.new_zeros_symint(c10::SymIntArrayRef(base_size));
+  auto base_size = std::max(
+      _min_storage_size(inp_sizes_, inp_strides_, inp_effective_offset),
+      _min_storage_size(out_sizes_, out_strides_, out_effective_offset));
+  auto storage = grad.new_empty_symint(c10::SymIntArrayRef(base_size));
+  storage.zero_();
 
   // prepare indices tensor if we will do index_add_ later
   c10::optional<at::Tensor> flatten_full_indices;
   if (inp_maybe_overlap || out_maybe_overlap) {
     flatten_full_indices =
-        // TODO: should we symint-ify arange? Need SymScalar.
-        at::arange(
-            0,
-            base_size.guard_int(__FILE__, __LINE__),
-            grad.options().dtype(at::kLong));
         at::arange(0, base_size, grad.options().dtype(at::kLong));
   }
 
   // Step (2): use output geometry to scatter gradients into storage
 
@@ -215,11 +215,11 @@ at::Tensor logcumsumexp_backward(
     at::Tensor result,
     int64_t dim);
 at::Tensor unbind_backward(const variable_list& grads, int64_t dim);
-at::Tensor unsqueeze_to(const at::Tensor& self, c10::SymIntArrayRef sym_sizes);
+at::Tensor unsqueeze_to(const at::Tensor& self, at::IntArrayRef sizes);
 at::Tensor unsqueeze_to(
     const at::Tensor& self,
     int64_t dim,
-    c10::SymIntArrayRef sym_sizes);
+    at::IntArrayRef sizes);
 std::vector<at::Tensor> cat_tensors_backward(
     const at::Tensor& grad,
     const std::vector<std::vector<c10::SymInt>>& sizes,