pytorch
diff --git a/‎aten/src/ATen/Dispatch_v2.h
Lines changed: 170 additions & 0 deletions b/‎aten/src/ATen/Dispatch_v2.h
Lines changed: 170 additions & 0 deletions
diff --git a/‎aten/src/ATen/native/Scalar.cpp
Lines changed: 13 additions & 22 deletions b/‎aten/src/ATen/native/Scalar.cpp
Lines changed: 13 additions & 22 deletions
diff --git a/‎aten/src/ATen/native/cpu/FillKernel.cpp
Lines changed: 11 additions & 8 deletions b/‎aten/src/ATen/native/cpu/FillKernel.cpp
Lines changed: 11 additions & 8 deletions
diff --git a/‎aten/src/ATen/native/transformers/sdp_utils_cpp.h
Lines changed: 2 additions & 6 deletions b/‎aten/src/ATen/native/transformers/sdp_utils_cpp.h
Lines changed: 2 additions & 6 deletions
diff --git a/‎c10/core/ScalarType.cpp
Lines changed: 4 additions & 5 deletions b/‎c10/core/ScalarType.cpp
Lines changed: 4 additions & 5 deletions
diff --git a/‎c10/util/Array.h
Lines changed: 16 additions & 0 deletions b/‎c10/util/Array.h
Lines changed: 16 additions & 0 deletions
@@ -1,6 +1,6 @@
 #define TORCH_ASSERT_ONLY_METHOD_OPERATORS
 #include <ATen/core/Tensor.h>
-#include <ATen/Dispatch.h>
+#include <ATen/Dispatch_v2.h>
 
 #ifndef AT_PER_OPERATOR_HEADERS
 #include <ATen/Functions.h>
@@ -27,33 +27,24 @@ Scalar item(const Tensor& self) {
   }
 }
 
+#define AT_SD_BASE_TYPES AT_EXPAND(AT_ALL_TYPES), AT_EXPAND(AT_COMPLEX_TYPES), kComplexHalf, kHalf, kBool, kBFloat16
 #if !defined(C10_MOBILE)
-#define _AT_DISPATCH_SD_TYPES(TYPE, NAME, ...) \
-  AT_DISPATCH_ALL_TYPES_AND_COMPLEX_AND8(      \
-      kComplexHalf,                            \
-      kHalf,                                   \
-      kBool,                                   \
-      kBFloat16,                               \
-      kFloat8_e5m2,                            \
-      kFloat8_e5m2fnuz,                        \
-      kFloat8_e4m3fn,                          \
-      kFloat8_e4m3fnuz,                        \
-      TYPE,                                    \
-      NAME,                                    \
-      __VA_ARGS__)
+#define AT_SD_TYPES AT_EXPAND(AT_SD_BASE_TYPES), AT_EXPAND(AT_FLOAT8_TYPES)
 #else
-#define _AT_DISPATCH_SD_TYPES(TYPE, NAME, ...)     \
-        AT_DISPATCH_ALL_TYPES_AND_COMPLEX_AND4(    \
-            kComplexHalf, kHalf, kBool, kBFloat16, \
-            TYPE, NAME, __VA_ARGS__)
+#define AT_SD_TYPES AT_EXPAND(AT_SD_BASE_TYPES)
 #endif
 
 Scalar _local_scalar_dense_cpu(const Tensor& self) {
   Scalar r;
-  _AT_DISPATCH_SD_TYPES(self.scalar_type(), "_local_scalar_dense_cpu", [&] {
-        scalar_t value = *self.data_ptr<scalar_t>();
-        r = Scalar(value);
-      });
+  AT_DISPATCH_V2(
+    self.scalar_type(),
+    "_local_scalar_dense_cpu",
+    AT_WRAP([&] {
+      scalar_t value = *self.data_ptr<scalar_t>();
+      r = Scalar(value);
+    }),
+    AT_EXPAND(AT_SD_TYPES)
+  );
   return r;
 }
 
 
@@ -1,5 +1,5 @@
 #define TORCH_ASSERT_NO_OPERATORS
-#include <ATen/Dispatch.h>
+#include <ATen/Dispatch_v2.h>
 #include <ATen/Parallel.h>
 #include <ATen/cpu/vec/vec.h>
 #include <ATen/cpu/vec/functional.h>
@@ -44,13 +44,16 @@ void fill_kernel(TensorIterator& iter, const Scalar& value_scalar) {
   } else if (iter.dtype() == ScalarType::ComplexHalf) {
     fill_non_native_type<c10::complex<at::Half>>(iter, value_scalar);
   } else {
-    AT_DISPATCH_ALL_TYPES_AND_COMPLEX_AND(at::ScalarType::Bool, iter.dtype(), "fill_cpu", [&]() {
-      scalar_t value = value_scalar.to<scalar_t>();
-      cpu_kernel_vec(
-          iter,
-          [=]() -> scalar_t { return value; },
-          [=]() { return Vectorized<scalar_t>(value); });
-    });
+    AT_DISPATCH_V2(
+      iter.dtype(), "fill_cpu", AT_WRAP([&]() {
+        scalar_t value = value_scalar.to<scalar_t>();
+        cpu_kernel_vec(
+            iter,
+            [=]() -> scalar_t { return value; },
+            [=]() { return Vectorized<scalar_t>(value); });
+      }),
+      AT_EXPAND(AT_ALL_TYPES_AND_COMPLEX), kBool
+    );
   }
 }
 
 
@@ -15,6 +15,7 @@
 #include <c10/core/SymInt.h>
 #include <c10/core/SymFloat.h>
 #include <c10/util/string_view.h>
+#include <c10/util/Array.h>
 #include <cmath>
 #include <cstdint>
 #include <functional>
@@ -58,12 +59,7 @@ inline c10::SymFloat calculate_scale(
   return c10::SymFloat(softmax_scale);
 }
 
-// This helper function creates a constexpr std::array
-// From a compile time list of values
-template <typename V, typename... T>
-inline constexpr auto array_of(T&&... t) -> std::array<V, sizeof...(T)> {
-  return {{std::forward<T>(t)...}};
-}
+using c10::array_of;
 
 inline bool input_requires_grad(sdp_params const& params) {
   const bool any_inputs_require_grad = params.query.requires_grad() ||
 
@@ -1,4 +1,5 @@
 #include <c10/core/ScalarType.h>
+#include <c10/util/Array.h>
 #include <array>
 
 namespace c10 {
@@ -20,10 +21,8 @@ constexpr auto b1 = ScalarType::Bool;
 constexpr auto bf = ScalarType::BFloat16;
 constexpr auto ud = ScalarType::Undefined;
 
-constexpr int64_t NUM_PROMOTE_TYPES = 20;
-
-constexpr std::array<ScalarType, NUM_PROMOTE_TYPES> index2dtype =
-    {u1, i1, i2, i4, i8, f2, f4, f8, c2, c4, c8, b1, bf};
+constexpr auto index2dtype = array_of<
+    c10::ScalarType>(u1, i1, i2, i4, i8, f2, f4, f8, c2, c4, c8, b1, bf);
 
 constexpr std::array<int64_t, static_cast<size_t>(ScalarType::NumOptions)>
 calculate_dtype2index() {
@@ -83,7 +82,7 @@ ScalarType promoteTypes(ScalarType a, ScalarType b) {
   // This table axes must be consistent with index2dtype
   // clang-format off
   static constexpr std::
-  array<std::array<ScalarType, NUM_PROMOTE_TYPES>, NUM_PROMOTE_TYPES>
+  array<std::array<ScalarType, index2dtype.size()>, index2dtype.size()>
       _promoteTypesLookup = {{
       /*        u1  i1  i2  i4  i8  f2  f4  f8  c2  c4  c8  b1  bf*/
       /* u1 */ {u1, i2, i2, i4, i8, f2, f4, f8, c2, c4, c8, u1, bf},
 
@@ -0,0 +1,16 @@
+#include <array>
+#include <utility>
+
+namespace c10 {
+
+// This helper function creates a constexpr std::array
+// From a compile time list of values, without requiring you to explicitly
+// write out the length.
+//
+// See also https://stackoverflow.com/a/26351760/23845
+template <typename V, typename... T>
+inline constexpr auto array_of(T&&... t) -> std::array<V, sizeof...(T)> {
+  return {{std::forward<T>(t)...}};
+}
+
+} // namespace c10