Support folding min(poly,poly) to const

author Lehua Ding <lehua.ding@rivai.ai>

Fri, 8 Sep 2023 08:54:19 +0000 (16:54 +0800)

committer Lehua Ding <lehua.ding@rivai.ai>

Sat, 9 Sep 2023 00:58:11 +0000 (08:58 +0800)
author Lehua Ding <lehua.ding@rivai.ai>
Fri, 8 Sep 2023 08:54:19 +0000 (16:54 +0800)
committer Lehua Ding <lehua.ding@rivai.ai>
Sat, 9 Sep 2023 00:58:11 +0000 (08:58 +0800)
diff --git a/gcc/fold-const.cc b/gcc/fold-const.cc

index 1da498a3152f6eca2e4f4fd202b3ccecafdab180..d19b4666c6521e08736a70dadb421c0f6e54aaf9 100644 (file)
--- a/gcc/fold-const.cc
+++ b/gcc/fold-const.cc
@@ -1213,6 +1213,25 @@ wide_int_binop (wide_int &res,
    return true;
  }
  
+/* Returns true if we know who is smaller or equal, ARG1 or ARG2, and set the
+   min value to RES.  */
+bool
+can_min_p (const_tree arg1, const_tree arg2, poly_wide_int &res)
+{
+  if (known_le (wi::to_poly_widest (arg1), wi::to_poly_widest (arg2)))
+    {
+      res = wi::to_poly_wide (arg1);
+      return true;
+    }
+  else if (known_le (wi::to_poly_widest (arg2), wi::to_poly_widest (arg1)))
+    {
+      res = wi::to_poly_wide (arg2);
+      return true;
+    }
+
+  return false;
+}
+
  /* Combine two poly int's ARG1 and ARG2 under operation CODE to
     produce a new constant in RES.  Return FALSE if we don't know how
     to evaluate CODE at compile-time.  */
@@ -1261,6 +1280,11 @@ poly_int_binop (poly_wide_int &res, enum tree_code code,
         return false;
        break;
  
+    case MIN_EXPR:
+      if (!can_min_p (arg1, arg2, res))
+       return false;
+      break;
+
      default:
        return false;
      }
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/fold-min-poly.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/fold-min-poly.c

new file mode 100644 (file)

index 0000000..de4c472
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/fold-min-poly.c
@@ -0,0 +1,24 @@
+/* { dg-do compile } */
+/* { dg-options " -march=rv64gcv_zvl128b -mabi=lp64d -O3 --param riscv-autovec-preference=scalable --param riscv-autovec-lmul=m1 -fno-vect-cost-model" } */
+
+void foo1 (int* restrict a, int* restrict b, int n)
+{
+    for (int i = 0; i < 4; i += 1)
+      a[i] += b[i];
+}
+
+void foo2 (int* restrict a, int* restrict b, int n)
+{
+    for (int i = 0; i < 3; i += 1)
+      a[i] += b[i];
+}
+
+void foo3 (int* restrict a, int* restrict b, int n)
+{
+    for (int i = 0; i < 5; i += 1)
+      a[i] += b[i];
+}
+
+/* { dg-final { scan-assembler-not {\tcsrr\t} } } */
+/* { dg-final { scan-assembler {\tvsetivli\tzero,4,e32,m1,t[au],m[au]} } } */
+/* { dg-final { scan-assembler {\tvsetivli\tzero,3,e32,m1,t[au],m[au]} } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/div-1.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/div-1.c

index f3388a86e3895604ea194bf5ad3f38301111514f..40224c69458e4049766195b59f67baff4a3ec0da 100644 (file)
--- a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/div-1.c
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/div-1.c
@@ -55,4 +55,4 @@ DEF_OP_VV (div, 512, int64_t, /)
  
  /* { dg-final { scan-assembler-times {vdivu?\.vv\s+v[0-9]+,\s*v[0-9]+,\s*v[0-9]+} 42 } } */
  /* TODO: Ideally, we should make sure there is no "csrr vlenb". However, we still have 'csrr vlenb' for some cases since we don't support VLS mode conversion which are needed by division.  */
-/* { dg-final { scan-assembler-times {csrr} 19 } } */
+/* { dg-final { scan-assembler-not {csrr} } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/shift-3.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/shift-3.c

index 98822b15657106a66909506b0c7b8181589979b5..b34a349949bac5a2ce51ff17bf0a2c05ba7abfbb 100644 (file)
--- a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/shift-3.c
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/shift-3.c
@@ -55,4 +55,4 @@ DEF_OP_VV (shift, 512, int64_t, <<)
  
  /* { dg-final { scan-assembler-times {vsll\.vv\s+v[0-9]+,\s*v[0-9]+,\s*v[0-9]+} 41 } } */
  /* TODO: Ideally, we should make sure there is no "csrr vlenb". However, we still have 'csrr vlenb' for some cases since we don't support VLS mode conversion which are needed by division.  */
-/* { dg-final { scan-assembler-times {csrr} 18 } } */
+/* { dg-final { scan-assembler-not {csrr} } } */
author	Lehua Ding <lehua.ding@rivai.ai>
	Fri, 8 Sep 2023 08:54:19 +0000 (16:54 +0800)
committer	Lehua Ding <lehua.ding@rivai.ai>
	Sat, 9 Sep 2023 00:58:11 +0000 (08:58 +0800)
gcc/fold-const.cc		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/riscv/rvv/autovec/fold-min-poly.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/div-1.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/riscv/rvv/autovec/vls/shift-3.c		patch \| blob \| blame \| history