diff --git a/llvm/lib/Target/PowerPC/PPCISelLowering.cpp b/llvm/lib/Target/PowerPC/PPCISelLowering.cpp --- a/llvm/lib/Target/PowerPC/PPCISelLowering.cpp +++ b/llvm/lib/Target/PowerPC/PPCISelLowering.cpp @@ -925,10 +925,12 @@ if (Subtarget.hasVSX()) { setOperationAction(ISD::SCALAR_TO_VECTOR, MVT::v2f64, Legal); - setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v2f64, Legal); + if (Subtarget.isPPC64()) + setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v2f64, Legal); if (Subtarget.hasP8Vector()) { setOperationAction(ISD::SCALAR_TO_VECTOR, MVT::v4f32, Legal); - setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4f32, Legal); + if (Subtarget.isPPC64()) + setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4f32, Legal); } if (Subtarget.hasDirectMove() && isPPC64) { setOperationAction(ISD::SCALAR_TO_VECTOR, MVT::v16i8, Legal); @@ -940,7 +942,8 @@ setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v4i32, Legal); setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v2i64, Legal); } - setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v2f64, Legal); + if (Subtarget.isPPC64()) + setOperationAction(ISD::EXTRACT_VECTOR_ELT, MVT::v2f64, Legal); // The nearbyint variants are not allowed to raise the inexact exception // so we can only code-gen them with unsafe math. diff --git a/llvm/lib/Target/PowerPC/PPCInstrVSX.td b/llvm/lib/Target/PowerPC/PPCInstrVSX.td --- a/llvm/lib/Target/PowerPC/PPCInstrVSX.td +++ b/llvm/lib/Target/PowerPC/PPCInstrVSX.td @@ -2425,6 +2425,7 @@ // [HasVSX, HasOnlySwappingMemOps] // [HasVSX, HasOnlySwappingMemOps, IsBigEndian] // [HasVSX, HasP8Vector] +// [HasVSX, HasP8Vector, IsBigEndian] // [HasVSX, HasP8Vector, IsBigEndian, IsPPC64] // [HasVSX, HasP8Vector, IsLittleEndian] // [HasVSX, HasP8Vector, NoP9Vector, IsBigEndian, IsPPC64] @@ -3144,8 +3145,8 @@ (v16i8 (COPY_TO_REGCLASS(XXLEQVOnes), VSRC))>; } // HasVSX, HasP8Vector -// Big endian Power8 VSX subtarget. -let Predicates = [HasVSX, HasP8Vector, IsBigEndian, IsPPC64] in { +// Any big endian Power8 VSX subtarget. +let Predicates = [HasVSX, HasP8Vector, IsBigEndian] in { def : Pat; def : Pat; def : Pat<(f64 (PPCfcfid (f64 (PPCmtvsra (i32 (extractelt v4i32:$A, 3)))))), (f64 (COPY_TO_REGCLASS (XVCVSXWDP (XXSPLTW $A, 3)), VSFRC))>; +} // HasVSX, HasP8Vector, IsBigEndian +// Big endian Power8 64Bit VSX subtarget. +let Predicates = [HasVSX, HasP8Vector, IsBigEndian, IsPPC64] in { // LIWAX - This instruction is used for sign extending i32 -> i64. // LIWZX - This instruction will be emitted for i32, f32, and when // zero-extending i32 to i64 (zext i32 -> i64). diff --git a/llvm/test/CodeGen/PowerPC/aix-p8-scalar_vector_conversions.ll b/llvm/test/CodeGen/PowerPC/aix-p8-scalar_vector_conversions.ll new file mode 100644 --- /dev/null +++ b/llvm/test/CodeGen/PowerPC/aix-p8-scalar_vector_conversions.ll @@ -0,0 +1,1766 @@ +; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py +; RUN: llc < %s -mtriple=powerpc64-ibm-aix-xcoff -verify-machineinstrs \ +; RUN: -mcpu=pwr8 -vec-extabi | FileCheck %s --check-prefix=AIX64 +; RUN: llc < %s -mtriple=powerpc-ibm-aix-xcoff -verify-machineinstrs \ +; RUN: -mcpu=pwr8 -vec-extabi | FileCheck %s --check-prefix=AIX32 + +; The build[csilf] functions simply test the scalar_to_vector handling with +; direct moves. This corresponds to the "insertelement" instruction. Subsequent +; to this, there will be a splat corresponding to the shufflevector. + +@d = common global double 0.000000e+00, align 8 + +; Function Attrs: norecurse nounwind readnone +define <16 x i8> @buildc(i8 zeroext %a) { +; AIX64-LABEL: buildc: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: sldi 3, 3, 56 +; AIX64-NEXT: mtvsrd 34, 3 +; AIX64-NEXT: vspltb 2, 2, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: buildc: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: stb 3, -16(1) +; AIX32-NEXT: lxvw4x 34, 0, 4 +; AIX32-NEXT: vspltb 2, 2, 0 +; AIX32-NEXT: blr +entry: + %splat.splatinsert = insertelement <16 x i8> undef, i8 %a, i32 0 + %splat.splat = shufflevector <16 x i8> %splat.splatinsert, <16 x i8> undef, <16 x i32> zeroinitializer + ret <16 x i8> %splat.splat +} + +; Function Attrs: norecurse nounwind readnone +define <8 x i16> @builds(i16 zeroext %a) { +; AIX64-LABEL: builds: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: sldi 3, 3, 48 +; AIX64-NEXT: mtvsrd 34, 3 +; AIX64-NEXT: vsplth 2, 2, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: builds: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: sth 3, -16(1) +; AIX32-NEXT: lxvw4x 34, 0, 4 +; AIX32-NEXT: vsplth 2, 2, 0 +; AIX32-NEXT: blr +entry: + %splat.splatinsert = insertelement <8 x i16> undef, i16 %a, i32 0 + %splat.splat = shufflevector <8 x i16> %splat.splatinsert, <8 x i16> undef, <8 x i32> zeroinitializer + ret <8 x i16> %splat.splat +} + +; Function Attrs: norecurse nounwind readnone +define <4 x i32> @buildi(i32 zeroext %a) { +; AIX64-LABEL: buildi: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mtfprwz 0, 3 +; AIX64-NEXT: xxspltw 34, 0, 1 +; AIX64-NEXT: blr +; +; AIX32-LABEL: buildi: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: stw 3, -16(1) +; AIX32-NEXT: lxvw4x 0, 0, 4 +; AIX32-NEXT: xxspltw 34, 0, 0 +; AIX32-NEXT: blr +entry: + %splat.splatinsert = insertelement <4 x i32> undef, i32 %a, i32 0 + %splat.splat = shufflevector <4 x i32> %splat.splatinsert, <4 x i32> undef, <4 x i32> zeroinitializer + ret <4 x i32> %splat.splat +} + +; Function Attrs: norecurse nounwind readnone +define <2 x i64> @buildl(i64 %a) { +; AIX64-LABEL: buildl: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mtfprd 0, 3 +; AIX64-NEXT: xxmrghd 34, 0, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: buildl: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: stw 4, -16(1) +; AIX32-NEXT: stw 3, -32(1) +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: addi 4, 1, -32 +; AIX32-NEXT: lxvw4x 34, 0, 3 +; AIX32-NEXT: lxvw4x 35, 0, 4 +; AIX32-NEXT: vmrghw 2, 3, 2 +; AIX32-NEXT: xxswapd 0, 34 +; AIX32-NEXT: xxsldwi 34, 0, 34, 2 +; AIX32-NEXT: blr +entry: + %splat.splatinsert = insertelement <2 x i64> undef, i64 %a, i32 0 + %splat.splat = shufflevector <2 x i64> %splat.splatinsert, <2 x i64> undef, <2 x i32> zeroinitializer + ret <2 x i64> %splat.splat +} + +; Function Attrs: norecurse nounwind readnone +define <4 x float> @buildf(float %a) { +; AIX64-LABEL: buildf: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xscvdpspn 0, 1 +; AIX64-NEXT: xxspltw 34, 0, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: buildf: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: xscvdpspn 0, 1 +; AIX32-NEXT: xxspltw 34, 0, 0 +; AIX32-NEXT: blr +entry: + %splat.splatinsert = insertelement <4 x float> undef, float %a, i32 0 + %splat.splat = shufflevector <4 x float> %splat.splatinsert, <4 x float> undef, <4 x i32> zeroinitializer + ret <4 x float> %splat.splat +} + +; The optimization to remove stack operations from PPCDAGToDAGISel::Select +; should still trigger for v2f64, producing an lxvdsx. +; Function Attrs: norecurse nounwind readonly +define <2 x double> @buildd() { +; AIX64-LABEL: buildd: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: ld 3, L..C0(2) +; AIX64-NEXT: lxvdsx 34, 0, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: buildd: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: lwz 3, L..C0(2) +; AIX32-NEXT: lxvdsx 34, 0, 3 +; AIX32-NEXT: blr +entry: + %0 = load double, double* @d, align 8 + %splat.splatinsert = insertelement <2 x double> undef, double %0, i32 0 + %splat.splat = shufflevector <2 x double> %splat.splatinsert, <2 x double> undef, <2 x i32> zeroinitializer + ret <2 x double> %splat.splat +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc0(<16 x i8> %vsc) { +; AIX64-LABEL: getsc0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 8, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -16(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 0 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc1(<16 x i8> %vsc) { +; AIX64-LABEL: getsc1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 16, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -15(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 1 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc2(<16 x i8> %vsc) { +; AIX64-LABEL: getsc2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 24, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -14(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 2 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc3(<16 x i8> %vsc) { +; AIX64-LABEL: getsc3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 32, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -13(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 3 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc4(<16 x i8> %vsc) { +; AIX64-LABEL: getsc4: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 40, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc4: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -12(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 4 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc5(<16 x i8> %vsc) { +; AIX64-LABEL: getsc5: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 48, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc5: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -11(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 5 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc6(<16 x i8> %vsc) { +; AIX64-LABEL: getsc6: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 56, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc6: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -10(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 6 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc7(<16 x i8> %vsc) { +; AIX64-LABEL: getsc7: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc7: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -9(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 7 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc8(<16 x i8> %vsc) { +; AIX64-LABEL: getsc8: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 8, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc8: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -8(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 8 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc9(<16 x i8> %vsc) { +; AIX64-LABEL: getsc9: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 16, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc9: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -7(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 9 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc10(<16 x i8> %vsc) { +; AIX64-LABEL: getsc10: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 24, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc10: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -6(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 10 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc11(<16 x i8> %vsc) { +; AIX64-LABEL: getsc11: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 32, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc11: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -5(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 11 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc12(<16 x i8> %vsc) { +; AIX64-LABEL: getsc12: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 40, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc12: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -4(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 12 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc13(<16 x i8> %vsc) { +; AIX64-LABEL: getsc13: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 48, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc13: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -3(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 13 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc14(<16 x i8> %vsc) { +; AIX64-LABEL: getsc14: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 56, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc14: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -2(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 14 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getsc15(<16 x i8> %vsc) { +; AIX64-LABEL: getsc15: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsc15: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -1(1) +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 15 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc0(<16 x i8> %vuc) { +; AIX64-LABEL: getuc0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 8, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 0 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc1(<16 x i8> %vuc) { +; AIX64-LABEL: getuc1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 16, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -15(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 1 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc2(<16 x i8> %vuc) { +; AIX64-LABEL: getuc2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 24, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -14(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 2 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc3(<16 x i8> %vuc) { +; AIX64-LABEL: getuc3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 32, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -13(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 3 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc4(<16 x i8> %vuc) { +; AIX64-LABEL: getuc4: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 40, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc4: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 4 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc5(<16 x i8> %vuc) { +; AIX64-LABEL: getuc5: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 48, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc5: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -11(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 5 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc6(<16 x i8> %vuc) { +; AIX64-LABEL: getuc6: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 56, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc6: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -10(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 6 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc7(<16 x i8> %vuc) { +; AIX64-LABEL: getuc7: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc7: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -9(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 7 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc8(<16 x i8> %vuc) { +; AIX64-LABEL: getuc8: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 8, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc8: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -8(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 8 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc9(<16 x i8> %vuc) { +; AIX64-LABEL: getuc9: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 16, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc9: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -7(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 9 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc10(<16 x i8> %vuc) { +; AIX64-LABEL: getuc10: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 24, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc10: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -6(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 10 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc11(<16 x i8> %vuc) { +; AIX64-LABEL: getuc11: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 32, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc11: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -5(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 11 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc12(<16 x i8> %vuc) { +; AIX64-LABEL: getuc12: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 40, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc12: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 12 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc13(<16 x i8> %vuc) { +; AIX64-LABEL: getuc13: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 48, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc13: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -3(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 13 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc14(<16 x i8> %vuc) { +; AIX64-LABEL: getuc14: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 56, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc14: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -2(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 14 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getuc15(<16 x i8> %vuc) { +; AIX64-LABEL: getuc15: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getuc15: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lbz 3, -1(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 15 + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i8 @getvelsc(<16 x i8> %vsc, i32 signext %i) { +; AIX64-LABEL: getvelsc: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 5, 3, 8 +; AIX64-NEXT: li 4, 7 +; AIX64-NEXT: lvsl 3, 0, 5 +; AIX64-NEXT: andc 3, 4, 3 +; AIX64-NEXT: sldi 3, 3, 3 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 4, 34 +; AIX64-NEXT: srd 3, 4, 3 +; AIX64-NEXT: extsb 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelsc: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: clrlwi 3, 3, 28 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lbzx 3, 4, 3 +; AIX32-NEXT: extsb 3, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vsc, i32 %i + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i8 @getveluc(<16 x i8> %vuc, i32 signext %i) { +; AIX64-LABEL: getveluc: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 5, 3, 8 +; AIX64-NEXT: li 4, 7 +; AIX64-NEXT: lvsl 3, 0, 5 +; AIX64-NEXT: andc 3, 4, 3 +; AIX64-NEXT: sldi 3, 3, 3 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 4, 34 +; AIX64-NEXT: srd 3, 4, 3 +; AIX64-NEXT: clrldi 3, 3, 56 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getveluc: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: clrlwi 3, 3, 28 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lbzx 3, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <16 x i8> %vuc, i32 %i + ret i8 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss0(<8 x i16> %vss) { +; AIX64-LABEL: getss0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 16, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 0 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss1(<8 x i16> %vss) { +; AIX64-LABEL: getss1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 32, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -14(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 1 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss2(<8 x i16> %vss) { +; AIX64-LABEL: getss2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 48, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 2 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss3(<8 x i16> %vss) { +; AIX64-LABEL: getss3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -10(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 3 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss4(<8 x i16> %vss) { +; AIX64-LABEL: getss4: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 16, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss4: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -8(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 4 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss5(<8 x i16> %vss) { +; AIX64-LABEL: getss5: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 32, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss5: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -6(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 5 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss6(<8 x i16> %vss) { +; AIX64-LABEL: getss6: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 48, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss6: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 6 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getss7(<8 x i16> %vss) { +; AIX64-LABEL: getss7: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getss7: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lha 3, -2(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 7 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus0(<8 x i16> %vus) { +; AIX64-LABEL: getus0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 16, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 0 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus1(<8 x i16> %vus) { +; AIX64-LABEL: getus1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 32, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -14(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 1 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus2(<8 x i16> %vus) { +; AIX64-LABEL: getus2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: rldicl 3, 3, 48, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 2 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus3(<8 x i16> %vus) { +; AIX64-LABEL: getus3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -10(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 3 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus4(<8 x i16> %vus) { +; AIX64-LABEL: getus4: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 16, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus4: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -8(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 4 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus5(<8 x i16> %vus) { +; AIX64-LABEL: getus5: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 32, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus5: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -6(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 5 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus6(<8 x i16> %vus) { +; AIX64-LABEL: getus6: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: rldicl 3, 3, 48, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus6: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 6 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getus7(<8 x i16> %vus) { +; AIX64-LABEL: getus7: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getus7: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lhz 3, -2(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 7 + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i16 @getvelss(<8 x i16> %vss, i32 signext %i) { +; AIX64-LABEL: getvelss: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 5, 3, 4 +; AIX64-NEXT: li 4, 3 +; AIX64-NEXT: sldi 5, 5, 1 +; AIX64-NEXT: andc 3, 4, 3 +; AIX64-NEXT: lvsl 3, 0, 5 +; AIX64-NEXT: sldi 3, 3, 4 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 4, 34 +; AIX64-NEXT: srd 3, 4, 3 +; AIX64-NEXT: extsh 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelss: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: rlwinm 3, 3, 1, 28, 30 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lhax 3, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vss, i32 %i + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i16 @getvelus(<8 x i16> %vus, i32 signext %i) { +; AIX64-LABEL: getvelus: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 5, 3, 4 +; AIX64-NEXT: li 4, 3 +; AIX64-NEXT: sldi 5, 5, 1 +; AIX64-NEXT: andc 3, 4, 3 +; AIX64-NEXT: lvsl 3, 0, 5 +; AIX64-NEXT: sldi 3, 3, 4 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 4, 34 +; AIX64-NEXT: srd 3, 4, 3 +; AIX64-NEXT: clrldi 3, 3, 48 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelus: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: rlwinm 3, 3, 1, 28, 30 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lhzx 3, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <8 x i16> %vus, i32 %i + ret i16 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i32 @getsi0(<4 x i32> %vsi) { +; AIX64-LABEL: getsi0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxsldwi 0, 34, 34, 3 +; AIX64-NEXT: mffprwz 3, 0 +; AIX64-NEXT: extsw 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsi0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vsi, i32 0 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i32 @getsi1(<4 x i32> %vsi) { +; AIX64-LABEL: getsi1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrwz 3, 34 +; AIX64-NEXT: extsw 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsi1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vsi, i32 1 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i32 @getsi2(<4 x i32> %vsi) { +; AIX64-LABEL: getsi2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxsldwi 0, 34, 34, 1 +; AIX64-NEXT: mffprwz 3, 0 +; AIX64-NEXT: extsw 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsi2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -8(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vsi, i32 2 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i32 @getsi3(<4 x i32> %vsi) { +; AIX64-LABEL: getsi3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprwz 3, 0 +; AIX64-NEXT: extsw 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsi3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vsi, i32 3 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i32 @getui0(<4 x i32> %vui) { +; AIX64-LABEL: getui0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxsldwi 0, 34, 34, 3 +; AIX64-NEXT: mffprwz 3, 0 +; AIX64-NEXT: clrldi 3, 3, 32 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getui0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vui, i32 0 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i32 @getui1(<4 x i32> %vui) { +; AIX64-LABEL: getui1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrwz 3, 34 +; AIX64-NEXT: clrldi 3, 3, 32 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getui1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vui, i32 1 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i32 @getui2(<4 x i32> %vui) { +; AIX64-LABEL: getui2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxsldwi 0, 34, 34, 1 +; AIX64-NEXT: mffprwz 3, 0 +; AIX64-NEXT: clrldi 3, 3, 32 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getui2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -8(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vui, i32 2 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i32 @getui3(<4 x i32> %vui) { +; AIX64-LABEL: getui3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprwz 3, 0 +; AIX64-NEXT: clrldi 3, 3, 32 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getui3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vui, i32 3 + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define signext i32 @getvelsi(<4 x i32> %vsi, i32 signext %i) { +; AIX64-LABEL: getvelsi: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 5, 3, 2 +; AIX64-NEXT: li 4, 1 +; AIX64-NEXT: sldi 5, 5, 2 +; AIX64-NEXT: andc 3, 4, 3 +; AIX64-NEXT: lvsl 3, 0, 5 +; AIX64-NEXT: sldi 3, 3, 5 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 4, 34 +; AIX64-NEXT: srd 3, 4, 3 +; AIX64-NEXT: extsw 3, 3 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelsi: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: rlwinm 3, 3, 2, 28, 29 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lwzx 3, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vsi, i32 %i + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define zeroext i32 @getvelui(<4 x i32> %vui, i32 signext %i) { +; AIX64-LABEL: getvelui: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 5, 3, 2 +; AIX64-NEXT: li 4, 1 +; AIX64-NEXT: sldi 5, 5, 2 +; AIX64-NEXT: andc 3, 4, 3 +; AIX64-NEXT: lvsl 3, 0, 5 +; AIX64-NEXT: sldi 3, 3, 5 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 4, 34 +; AIX64-NEXT: srd 3, 4, 3 +; AIX64-NEXT: clrldi 3, 3, 32 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelui: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: rlwinm 3, 3, 2, 28, 29 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lwzx 3, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x i32> %vui, i32 %i + ret i32 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define i64 @getsl0(<2 x i64> %vsl) { +; AIX64-LABEL: getsl0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsl0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -16(1) +; AIX32-NEXT: lwz 4, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x i64> %vsl, i32 0 + ret i64 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define i64 @getsl1(<2 x i64> %vsl) { +; AIX64-LABEL: getsl1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getsl1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -8(1) +; AIX32-NEXT: lwz 4, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x i64> %vsl, i32 1 + ret i64 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define i64 @getul0(<2 x i64> %vul) { +; AIX64-LABEL: getul0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getul0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -16(1) +; AIX32-NEXT: lwz 4, -12(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x i64> %vul, i32 0 + ret i64 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define i64 @getul1(<2 x i64> %vul) { +; AIX64-LABEL: getul1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: mffprd 3, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getul1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lwz 3, -8(1) +; AIX32-NEXT: lwz 4, -4(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x i64> %vul, i32 1 + ret i64 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define i64 @getvelsl(<2 x i64> %vsl, i32 signext %i) { +; AIX64-LABEL: getvelsl: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 3, 3, 1 +; AIX64-NEXT: sldi 3, 3, 3 +; AIX64-NEXT: lvsl 3, 0, 3 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelsl: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: add 3, 3, 3 +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: addi 5, 3, 1 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: rlwinm 3, 3, 2, 28, 29 +; AIX32-NEXT: rlwinm 5, 5, 2, 28, 29 +; AIX32-NEXT: lwzx 3, 4, 3 +; AIX32-NEXT: lwzx 4, 4, 5 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x i64> %vsl, i32 %i + ret i64 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define i64 @getvelul(<2 x i64> %vul, i32 signext %i) { +; AIX64-LABEL: getvelul: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 3, 3, 1 +; AIX64-NEXT: sldi 3, 3, 3 +; AIX64-NEXT: lvsl 3, 0, 3 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: mfvsrd 3, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelul: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: add 3, 3, 3 +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: addi 5, 3, 1 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: rlwinm 3, 3, 2, 28, 29 +; AIX32-NEXT: rlwinm 5, 5, 2, 28, 29 +; AIX32-NEXT: lwzx 3, 4, 3 +; AIX32-NEXT: lwzx 4, 4, 5 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x i64> %vul, i32 %i + ret i64 %vecext +} + +; Function Attrs: norecurse nounwind readnone +define float @getf0(<4 x float> %vf) { +; AIX64-LABEL: getf0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xscvspdpn 1, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getf0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: lfs 1, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x float> %vf, i32 0 + ret float %vecext +} + +; Function Attrs: norecurse nounwind readnone +define float @getf1(<4 x float> %vf) { +; AIX64-LABEL: getf1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxsldwi 0, 34, 34, 1 +; AIX64-NEXT: xscvspdpn 1, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getf1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: li 4, 4 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: rlwimi 4, 3, 0, 30, 28 +; AIX32-NEXT: lfsx 1, 0, 4 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x float> %vf, i32 1 + ret float %vecext +} + +; Function Attrs: norecurse nounwind readnone +define float @getf2(<4 x float> %vf) { +; AIX64-LABEL: getf2: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 0, 34 +; AIX64-NEXT: xscvspdpn 1, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getf2: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: li 4, 8 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: rlwimi 4, 3, 0, 29, 27 +; AIX32-NEXT: lfsx 1, 0, 4 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x float> %vf, i32 2 + ret float %vecext +} + +; Function Attrs: norecurse nounwind readnone +define float @getf3(<4 x float> %vf) { +; AIX64-LABEL: getf3: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxsldwi 0, 34, 34, 3 +; AIX64-NEXT: xscvspdpn 1, 0 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getf3: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: li 4, 12 +; AIX32-NEXT: stxvw4x 34, 0, 3 +; AIX32-NEXT: rlwimi 4, 3, 0, 30, 27 +; AIX32-NEXT: lfsx 1, 0, 4 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x float> %vf, i32 3 + ret float %vecext +} + +; Function Attrs: norecurse nounwind readnone +define float @getvelf(<4 x float> %vf, i32 signext %i) { +; AIX64-LABEL: getvelf: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: sldi 3, 3, 2 +; AIX64-NEXT: lvsl 3, 0, 3 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: xscvspdpn 1, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getvelf: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: rlwinm 3, 3, 2, 28, 29 +; AIX32-NEXT: stxvw4x 34, 0, 4 +; AIX32-NEXT: lfsx 1, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <4 x float> %vf, i32 %i + ret float %vecext +} + +; Function Attrs: norecurse nounwind readnone +define double @getd0(<2 x double> %vd) { +; AIX64-LABEL: getd0: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxlor 1, 34, 34 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getd0: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: stxvd2x 34, 0, 3 +; AIX32-NEXT: lfd 1, -16(1) +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x double> %vd, i32 0 + ret double %vecext +} + +; Function Attrs: norecurse nounwind readnone +define double @getd1(<2 x double> %vd) { +; AIX64-LABEL: getd1: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: xxswapd 1, 34 +; AIX64-NEXT: # kill: def $f1 killed $f1 killed $vsl1 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getd1: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 3, 1, -16 +; AIX32-NEXT: li 4, 8 +; AIX32-NEXT: stxvd2x 34, 0, 3 +; AIX32-NEXT: rlwimi 4, 3, 0, 29, 27 +; AIX32-NEXT: lfdx 1, 0, 4 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x double> %vd, i32 1 + ret double %vecext +} + +; Function Attrs: norecurse nounwind readnone +define double @getveld(<2 x double> %vd, i32 signext %i) { +; AIX64-LABEL: getveld: +; AIX64: # %bb.0: # %entry +; AIX64-NEXT: andi. 3, 3, 1 +; AIX64-NEXT: sldi 3, 3, 3 +; AIX64-NEXT: lvsl 3, 0, 3 +; AIX64-NEXT: vperm 2, 2, 2, 3 +; AIX64-NEXT: xxlor 1, 34, 34 +; AIX64-NEXT: # kill: def $f1 killed $f1 killed $vsl1 +; AIX64-NEXT: blr +; +; AIX32-LABEL: getveld: +; AIX32: # %bb.0: # %entry +; AIX32-NEXT: addi 4, 1, -16 +; AIX32-NEXT: rlwinm 3, 3, 3, 28, 28 +; AIX32-NEXT: stxvd2x 34, 0, 4 +; AIX32-NEXT: lfdx 1, 4, 3 +; AIX32-NEXT: blr +entry: + %vecext = extractelement <2 x double> %vd, i32 %i + ret double %vecext +} diff --git a/llvm/test/CodeGen/PowerPC/cannonicalize-vector-shifts.ll b/llvm/test/CodeGen/PowerPC/cannonicalize-vector-shifts.ll --- a/llvm/test/CodeGen/PowerPC/cannonicalize-vector-shifts.ll +++ b/llvm/test/CodeGen/PowerPC/cannonicalize-vector-shifts.ll @@ -2,6 +2,12 @@ ; RUN: -verify-machineinstrs < %s | FileCheck %s ; RUN: llc -mcpu=pwr8 -mtriple=powerpc64-unknown-linux-gnu \ ; RUN: -verify-machineinstrs < %s | FileCheck %s + +; RUN: llc -mcpu=pwr8 -vec-extabi -mtriple=powerpc64-ibm-aix-xcoff \ +; RUN: -verify-machineinstrs < %s | FileCheck %s +; RUN: llc -mcpu=pwr8 -vec-extabi -mtriple=powerpc-ibm-aix-xcoff \ +; RUN: -verify-machineinstrs < %s | FileCheck %s + define <4 x i32> @test1(<4 x i32> %a) { entry: ; CHECK-LABEL: test1