arm: Add vld1_bf16 + vld1q_bf16 intrinsics

author Andrea Corallo <andrea.corallo@arm.com>

Thu, 29 Oct 2020 12:56:17 +0000 (13:56 +0100)

committer Andrea Corallo <andrea.corallo@arm.com>

Tue, 3 Nov 2020 13:21:27 +0000 (14:21 +0100)
author Andrea Corallo <andrea.corallo@arm.com>
Thu, 29 Oct 2020 12:56:17 +0000 (13:56 +0100)
committer Andrea Corallo <andrea.corallo@arm.com>
Tue, 3 Nov 2020 13:21:27 +0000 (14:21 +0100)
diff --git a/gcc/config/arm/arm-builtins.c b/gcc/config/arm/arm-builtins.c

index db505a4cbf9d19155a4ddecb40877b5cc7ee95e6..51e31807aa94c214f706f7616cca9a6a41ec6037 100644 (file)
--- a/gcc/config/arm/arm-builtins.c
+++ b/gcc/config/arm/arm-builtins.c
@@ -946,6 +946,9 @@ typedef struct {
  #define VAR13(T, N, A, B, C, D, E, F, G, H, I, J, K, L, M) \
    VAR12 (T, N, A, B, C, D, E, F, G, H, I, J, K, L) \
    VAR1 (T, N, M)
+#define VAR14(T, N, A, B, C, D, E, F, G, H, I, J, K, L, M, O) \
+  VAR13 (T, N, A, B, C, D, E, F, G, H, I, J, K, L, M) \
+  VAR1 (T, N, O)
  
  /* The builtin data can be found in arm_neon_builtins.def, arm_vfp_builtins.def
     and arm_acle_builtins.def.  The entries in arm_neon_builtins.def require
diff --git a/gcc/config/arm/arm_neon.h b/gcc/config/arm/arm_neon.h

index 432d77fb272788a440b996b9e4bc741a2ee1dd45..b77175eaa3e9b32c260934c795f7689433d2d882 100644 (file)
--- a/gcc/config/arm/arm_neon.h
+++ b/gcc/config/arm/arm_neon.h
@@ -19557,6 +19557,20 @@ vst4q_bf16 (bfloat16_t * __ptr, bfloat16x8x4_t __val)
    return __builtin_neon_vst4v8bf (__ptr, __bu.__o);
  }
  
+__extension__ extern __inline bfloat16x4_t
+__attribute__  ((__always_inline__, __gnu_inline__, __artificial__))
+vld1_bf16 (bfloat16_t const * __ptr)
+{
+  return __builtin_neon_vld1v4bf (__ptr);
+}
+
+__extension__ extern __inline bfloat16x8_t
+__attribute__  ((__always_inline__, __gnu_inline__, __artificial__))
+vld1q_bf16 (const bfloat16_t * __ptr)
+{
+  return __builtin_neon_vld1v8bf (__ptr);
+}
+
  __extension__ extern __inline bfloat16x4x2_t
  __attribute__  ((__always_inline__, __gnu_inline__, __artificial__))
  vld2_bf16 (bfloat16_t const * __ptr)
diff --git a/gcc/config/arm/arm_neon_builtins.def b/gcc/config/arm/arm_neon_builtins.def

index 7a5dae0c4c030ae463e583048d8fad90961563e3..07eda44cc5874b099e3d844ed16310a760135e45 100644 (file)
--- a/gcc/config/arm/arm_neon_builtins.def
+++ b/gcc/config/arm/arm_neon_builtins.def
@@ -310,8 +310,9 @@ VAR1 (TERNOP, vtbx1, v8qi)
  VAR1 (TERNOP, vtbx2, v8qi)
  VAR1 (TERNOP, vtbx3, v8qi)
  VAR1 (TERNOP, vtbx4, v8qi)
-VAR12 (LOAD1, vld1,
-        v8qi, v4hi, v4hf, v2si, v2sf, di, v16qi, v8hi, v8hf, v4si, v4sf, v2di)
+VAR14 (LOAD1, vld1,
+        v8qi, v4hi, v4hf, v2si, v2sf, di, v16qi, v8hi, v8hf, v4si, v4sf, v2di,
+        v4bf, v8bf)
  VAR12 (LOAD1LANE, vld1_lane,
         v8qi, v4hi, v2si, v2sf, di, v16qi, v8hi, v4si, v4sf, v2di, v4bf, v8bf)
  VAR10 (LOAD1, vld1_dup,
diff --git a/gcc/testsuite/gcc.target/arm/simd/vld1_bf16_1.c b/gcc/testsuite/gcc.target/arm/simd/vld1_bf16_1.c

new file mode 100644 (file)

index 0000000..b6b00dc
--- /dev/null
+++ b/gcc/testsuite/gcc.target/arm/simd/vld1_bf16_1.c
@@ -0,0 +1,29 @@
+/* { dg-do assemble } */
+/* { dg-require-effective-target arm_v8_2a_bf16_neon_ok } */
+/* { dg-add-options arm_v8_2a_bf16_neon } */
+/* { dg-additional-options "-save-temps -O2 -mfloat-abi=hard" }  */
+/* { dg-final { check-function-bodies "**" "" } } */
+
+#include "arm_neon.h"
+
+/*
+**test_vld1_bf16:
+**     vld1.16 {d0}, \[r0\]
+**     bx      lr
+*/
+bfloat16x4_t
+test_vld1_bf16 (bfloat16_t const *p)
+{
+  return vld1_bf16 (p);
+}
+
+/*
+**test_vld1q_bf16:
+**     vld1.16 {d0-d1}, \[r0\]
+**     bx      lr
+*/
+bfloat16x8_t
+test_vld1q_bf16 (bfloat16_t const *p)
+{
+  return vld1q_bf16 (p);
+}
author	Andrea Corallo <andrea.corallo@arm.com>
	Thu, 29 Oct 2020 12:56:17 +0000 (13:56 +0100)
committer	Andrea Corallo <andrea.corallo@arm.com>
	Tue, 3 Nov 2020 13:21:27 +0000 (14:21 +0100)
gcc/config/arm/arm-builtins.c		patch \| blob \| blame \| history
gcc/config/arm/arm_neon.h		patch \| blob \| blame \| history
gcc/config/arm/arm_neon_builtins.def		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/arm/simd/vld1_bf16_1.c	[new file with mode: 0644]	patch \| blob