]> gcc.gnu.org Git - gcc.git/commit
i386: Fix up V2DI and V1TI inequality comparisons [PR105613]
authorJakub Jelinek <jakub@redhat.com>
Tue, 17 May 2022 10:10:30 +0000 (12:10 +0200)
committerJakub Jelinek <jakub@redhat.com>
Tue, 17 May 2022 10:10:30 +0000 (12:10 +0200)
commit254cbf72661b932eb039220fccef9a2546ab8f4e
treea2ac77a581832b625452049403485f5b06aea5e8
parent4f94c38a9237b728b3a3f76c169b5b47f6c45187
i386: Fix up V2DI and V1TI inequality comparisons [PR105613]

The recent r13-458 change to introduce vec_cmpeqv1tiv1ti and
add TARGET_SSE2 support to vec_cmpeqv2div2di works nicely for
equality comparisons, but as the testcase shows doesn't work
for inequality comparisons.
For EQ if we perform comparison with twice as many half-sized elemenets,
the result should be ~0 when both halves are ~0 only (both halves need
to be equal for the whole to be equal), otherwise 0, so AND is the
correct operation for it.
But for NE, the result should be ~0 when either of the halves is ~0
(if either half is not equal, the whole is not equal) and so the right
operation for NE is IOR, not AND.

2022-05-17  Jakub Jelinek  <jakub@redhat.com>

PR target/105613
* config/i386/sse.md (vec_cmpeqv2div2di, vec_cmpeqv1tiv1ti): Use
andv4si3 only for EQ, for NE use iorv4si3 instead.

* gcc.c-torture/execute/pr105613.c: New test.
gcc/config/i386/sse.md
gcc/testsuite/gcc.c-torture/execute/pr105613.c [new file with mode: 0644]
This page took 0.069881 seconds and 6 git commands to generate.