Index: lib/CodeGen/SelectionDAG/DAGCombiner.cpp =================================================================== --- lib/CodeGen/SelectionDAG/DAGCombiner.cpp +++ lib/CodeGen/SelectionDAG/DAGCombiner.cpp @@ -13493,6 +13493,12 @@ } } + // Remove redundant insertions: + // (insert_vector_elt x (extract_vector_elt x idx) idx) -> x + if (InVal.getOpcode() == ISD::EXTRACT_VECTOR_ELT && + InVec == InVal->getOperand(0) && EltNo == InVal->getOperand(1)) + return InVec; + // If we can't generate a legal BUILD_VECTOR, exit if (LegalOperations && !TLI.isOperationLegal(ISD::BUILD_VECTOR, VT)) return SDValue(); Index: test/CodeGen/X86/vector-shift-ashr-256.ll =================================================================== --- test/CodeGen/X86/vector-shift-ashr-256.ll +++ test/CodeGen/X86/vector-shift-ashr-256.ll @@ -45,7 +45,7 @@ ; ; AVX2-LABEL: var_shift_v4i64: ; AVX2: # BB#0: -; AVX2-NEXT: vpbroadcastq {{.*}}(%rip), %ymm2 +; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808] ; AVX2-NEXT: vpsrlvq %ymm1, %ymm2, %ymm3 ; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0 ; AVX2-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0 @@ -66,7 +66,7 @@ ; ; XOPAVX2-LABEL: var_shift_v4i64: ; XOPAVX2: # BB#0: -; XOPAVX2-NEXT: vpbroadcastq {{.*}}(%rip), %ymm2 +; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808] ; XOPAVX2-NEXT: vpsrlvq %ymm1, %ymm2, %ymm3 ; XOPAVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0 ; XOPAVX2-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0 @@ -667,7 +667,7 @@ ; ; AVX2-LABEL: splatvar_shift_v4i64: ; AVX2: # BB#0: -; AVX2-NEXT: vpbroadcastq {{.*}}(%rip), %ymm2 +; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808] ; AVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2 ; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 ; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0 @@ -687,7 +687,7 @@ ; ; XOPAVX2-LABEL: splatvar_shift_v4i64: ; XOPAVX2: # BB#0: -; XOPAVX2-NEXT: vpbroadcastq {{.*}}(%rip), %ymm2 +; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808] ; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2 ; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 ; XOPAVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0 @@ -708,8 +708,6 @@ ; ; X32-AVX1-LABEL: splatvar_shift_v4i64: ; X32-AVX1: # BB#0: -; X32-AVX1-NEXT: vpextrd $1, %xmm1, %eax -; X32-AVX1-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; X32-AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,2147483648,0,2147483648] ; X32-AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2 ; X32-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3 @@ -724,8 +722,6 @@ ; ; X32-AVX2-LABEL: splatvar_shift_v4i64: ; X32-AVX2: # BB#0: -; X32-AVX2-NEXT: vpextrd $1, %xmm1, %eax -; X32-AVX2-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; X32-AVX2-NEXT: vmovdqa {{.*#+}} ymm2 = [0,2147483648,0,2147483648,0,2147483648,0,2147483648] ; X32-AVX2-NEXT: vpsrlq %xmm1, %ymm2, %ymm2 ; X32-AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 @@ -1700,7 +1696,7 @@ ; XOPAVX2-LABEL: splatconstant_shift_v4i64: ; XOPAVX2: # BB#0: ; XOPAVX2-NEXT: vpsrlq $7, %ymm0, %ymm0 -; XOPAVX2-NEXT: vpbroadcastq {{.*}}(%rip), %ymm1 +; XOPAVX2-NEXT: vpbroadcastq {{.*#+}} ymm1 = [72057594037927936,72057594037927936,72057594037927936,72057594037927936] ; XOPAVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0 ; XOPAVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0 ; XOPAVX2-NEXT: retq Index: test/CodeGen/X86/vector-shift-lshr-256.ll =================================================================== --- test/CodeGen/X86/vector-shift-lshr-256.ll +++ test/CodeGen/X86/vector-shift-lshr-256.ll @@ -562,8 +562,6 @@ ; ; X32-AVX1-LABEL: splatvar_shift_v4i64: ; X32-AVX1: # BB#0: -; X32-AVX1-NEXT: vpextrd $1, %xmm1, %eax -; X32-AVX1-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; X32-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2 ; X32-AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm2 ; X32-AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0 @@ -572,8 +570,6 @@ ; ; X32-AVX2-LABEL: splatvar_shift_v4i64: ; X32-AVX2: # BB#0: -; X32-AVX2-NEXT: vpextrd $1, %xmm1, %eax -; X32-AVX2-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; X32-AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 ; X32-AVX2-NEXT: retl %splat = shufflevector <4 x i64> %b, <4 x i64> undef, <4 x i32> zeroinitializer Index: test/CodeGen/X86/vector-shift-shl-256.ll =================================================================== --- test/CodeGen/X86/vector-shift-shl-256.ll +++ test/CodeGen/X86/vector-shift-shl-256.ll @@ -506,8 +506,6 @@ ; ; X32-AVX1-LABEL: splatvar_shift_v4i64: ; X32-AVX1: # BB#0: -; X32-AVX1-NEXT: vpextrd $1, %xmm1, %eax -; X32-AVX1-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; X32-AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2 ; X32-AVX1-NEXT: vpsllq %xmm1, %xmm2, %xmm2 ; X32-AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0 @@ -516,8 +514,6 @@ ; ; X32-AVX2-LABEL: splatvar_shift_v4i64: ; X32-AVX2: # BB#0: -; X32-AVX2-NEXT: vpextrd $1, %xmm1, %eax -; X32-AVX2-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; X32-AVX2-NEXT: vpsllq %xmm1, %ymm0, %ymm0 ; X32-AVX2-NEXT: retl %splat = shufflevector <4 x i64> %b, <4 x i64> undef, <4 x i32> zeroinitializer Index: test/CodeGen/X86/vector-shuffle-512-v8.ll =================================================================== --- test/CodeGen/X86/vector-shuffle-512-v8.ll +++ test/CodeGen/X86/vector-shuffle-512-v8.ll @@ -2735,8 +2735,6 @@ ; AVX512F-32-LABEL: test_v8i64_2_5: ; AVX512F-32: # BB#0: ; AVX512F-32-NEXT: vextracti32x4 $1, %zmm0, %xmm1 -; AVX512F-32-NEXT: vpextrd $1, %xmm1, %eax -; AVX512F-32-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1 ; AVX512F-32-NEXT: vextracti32x4 $2, %zmm0, %xmm0 ; AVX512F-32-NEXT: vpextrd $2, %xmm0, %eax ; AVX512F-32-NEXT: vpinsrd $2, %eax, %xmm1, %xmm1