[Bug ipa/95790] Incorrect static target dispatch

yyc1992 at gmail dot com gcc-bugzilla@gcc.gnu.org
Sat Jun 20 19:26:16 GMT 2020


--- Comment #3 from Yichao Yu <yyc1992 at gmail dot com> ---
And the assembly showing the correct dispatch is

        .file   "a.c"
        .p2align 4
        .type   _ZL3fooPKcj, @function
        movl    $1, %eax
        .size   _ZL3fooPKcj, .-_ZL3fooPKcj
        .p2align 4
        .type   _ZL3fooPKcj.avx, @function
        movl    $2, %eax
        .size   _ZL3fooPKcj.avx, .-_ZL3fooPKcj.avx
        .p2align 4
        .type   _ZL3fooPKcj.avx512f, @function
        movl    $3, %eax
        .size   _ZL3fooPKcj.avx512f, .-_ZL3fooPKcj.avx512f
        .section        .text.unlikely,"ax",@progbits
        .p2align 4
        .type   _ZL3fooPKcj.resolver, @function
        subq    $8, %rsp
        .cfi_def_cfa_offset 16
        call    __cpu_indicator_init@PLT
        movq    __cpu_model@GOTPCREL(%rip), %rax
        movl    12(%rax), %eax
        testb   $-128, %ah
        je      .L8
        leaq    _ZL3fooPKcj.avx512f(%rip), %rax
        addq    $8, %rsp
        .cfi_def_cfa_offset 8
        .section        .text.unlikely
        .type   _ZL3fooPKcj.resolver.cold, @function
        .cfi_def_cfa_offset 16
        testb   $2, %ah
        leaq    _ZL3fooPKcj.avx(%rip), %rdx
        leaq    _ZL3fooPKcj(%rip), %rax
        cmovne  %rdx, %rax
        jmp     .L7
        .size   _ZL3fooPKcj.resolver, .-_ZL3fooPKcj.resolver
        .section        .text.unlikely
        .size   _ZL3fooPKcj.resolver.cold, .-_ZL3fooPKcj.resolver.cold
        .type   _Z11_ZL3fooPKcjPKcj, @gnu_indirect_function
        .set    _Z11_ZL3fooPKcjPKcj,_ZL3fooPKcj.resolver
        .p2align 4
        .globl  _Z3barv
        .type   _Z3barv, @function
        pushq   %r12
        .cfi_def_cfa_offset 16
        .cfi_offset 12, -16
        xorl    %r12d, %r12d
        pushq   %rbp
        .cfi_def_cfa_offset 24
        .cfi_offset 6, -24
        pushq   %rbx
        .cfi_def_cfa_offset 32
        .cfi_offset 3, -32
        subq    $4112, %rsp
        .cfi_def_cfa_offset 4144
        movq    %fs:40, %rax
        movq    %rax, 4104(%rsp)
        xorl    %eax, %eax
        movq    %rsp, %rbx
        leaq    4096(%rsp), %rbp
        .p2align 4,,10
        .p2align 3
        movq    %rbx, %rdi
        movl    $1, %esi
        addq    $1, %rbx
        call    _Z11_ZL3fooPKcjPKcj@PLT
        addl    %eax, %r12d
        cmpq    %rbp, %rbx
        jne     .L12
        movq    4104(%rsp), %rax
        subq    %fs:40, %rax
        jne     .L16
        addq    $4112, %rsp
        .cfi_def_cfa_offset 32
        movl    %r12d, %eax
        popq    %rbx
        .cfi_def_cfa_offset 24
        popq    %rbp
        .cfi_def_cfa_offset 16
        popq    %r12
        .cfi_def_cfa_offset 8
        call    __stack_chk_fail@PLT
        .size   _Z3barv, .-_Z3barv
        .p2align 4
        .globl  _Z3barv.avx
        .type   _Z3barv.avx, @function
        pushq   %r12
        .cfi_def_cfa_offset 16
        .cfi_offset 12, -16
        xorl    %r12d, %r12d
        pushq   %rbp
        .cfi_def_cfa_offset 24
        .cfi_offset 6, -24
        pushq   %rbx
        .cfi_def_cfa_offset 32
        .cfi_offset 3, -32
        subq    $4112, %rsp
        .cfi_def_cfa_offset 4144
        movq    %fs:40, %rax
        movq    %rax, 4104(%rsp)
        xorl    %eax, %eax
        movq    %rsp, %rbx
        leaq    4096(%rsp), %rbp
        .p2align 4,,10
        .p2align 3
        movq    %rbx, %rdi
        movl    $1, %esi
        addq    $1, %rbx
        call    _Z11_ZL3fooPKcjPKcj@PLT
        addl    %eax, %r12d
        cmpq    %rbp, %rbx
        jne     .L18
        movq    4104(%rsp), %rax
        subq    %fs:40, %rax
        jne     .L22
        addq    $4112, %rsp
        .cfi_def_cfa_offset 32
        movl    %r12d, %eax
        popq    %rbx
        .cfi_def_cfa_offset 24
        popq    %rbp
        .cfi_def_cfa_offset 16
        popq    %r12
        .cfi_def_cfa_offset 8
        call    __stack_chk_fail@PLT
        .size   _Z3barv.avx, .-_Z3barv.avx
        .ident  "GCC: (GNU) 10.1.0"
        .section        .note.GNU-stack,"",@progbits

More information about the Gcc-bugs mailing list