numpy · Mousius · Jun 12, 2025
diff --git a/numpy/_core/src/common/simd/neon/math.h b/numpy/_core/src/common/simd/neon/math.h
@@ -261,8 +261,8 @@ NPY_FINLINE npyv_s64 npyv_min_s64(npyv_s64 a, npyv_s64 b)
 #define NPY_IMPL_NEON_REDUCE_MINMAX(INTRIN, STYPE, SFX, OP)       \
     NPY_FINLINE STYPE npyv_reduce_##INTRIN##_##SFX(npyv_##SFX a)  \
     {                                                             \
-        STYPE al = (STYPE)vget_low_##SFX(a);                      \
-        STYPE ah = (STYPE)vget_high_##SFX(a);                     \
+        STYPE al = (STYPE)vgetq_lane_##SFX(a, 0);                 \
+        STYPE ah = (STYPE)vgetq_lane_##SFX(a, 1);                 \
         return al OP ah ? al : ah;                                \
     }
 NPY_IMPL_NEON_REDUCE_MINMAX(max, npy_uint64, u64, >)

diff --git a/numpy/_core/src/multiarray/lowlevel_strided_loops.c.src b/numpy/_core/src/multiarray/lowlevel_strided_loops.c.src
@@ -704,7 +704,7 @@ NPY_NO_EXPORT PyArrayMethod_StridedLoop *
 
 /************* STRIDED CASTING SPECIALIZED FUNCTIONS *************/
 
-#if defined(NPY_HAVE_NEON_FP16)
+#if defined(NPY_HAVE_NEON_FP16) && !defined(_MSC_VER)
     #define EMULATED_FP16 0
     #define NATIVE_FP16 1
     typedef _Float16 _npy_half;

diff --git a/numpy/distutils/checks/cpu_neon_fp16.c b/numpy/distutils/checks/cpu_neon_fp16.c
@@ -6,6 +6,6 @@
 int main(int argc, char **argv)
 {
     short *src = (short*)argv[argc-1];
-    float32x4_t v_z4 = vcvt_f32_f16((float16x4_t)vld1_s16(src));
+    float32x4_t v_z4 = vcvt_f32_f16(vreinterpret_f16_s16(vld1_s16(src)));
     return (int)vgetq_lane_f32(v_z4, 0);
 }