Diff 347865

llvm/lib/Transforms/InstCombine/InstCombineVectorOps.cpp

Show First 20 Lines • Show All 424 Lines • ▼ Show 20 Lines	if (auto *I = dyn_cast<Instruction>(SrcVec)) {
if (auto *IE = dyn_cast<InsertElementInst>(I)) {		if (auto *IE = dyn_cast<InsertElementInst>(I)) {
// Extracting the inserted element?		// Extracting the inserted element?
if (IE->getOperand(2) == Index)		if (IE->getOperand(2) == Index)
return replaceInstUsesWith(EI, IE->getOperand(1));		return replaceInstUsesWith(EI, IE->getOperand(1));
// If the inserted and extracted elements are constants, they must not		// If the inserted and extracted elements are constants, they must not
// be the same value, extract from the pre-inserted value instead.		// be the same value, extract from the pre-inserted value instead.
if (isa<Constant>(IE->getOperand(2)) && IndexC)		if (isa<Constant>(IE->getOperand(2)) && IndexC)
return replaceOperand(EI, 0, IE->getOperand(0));		return replaceOperand(EI, 0, IE->getOperand(0));
		} else if (auto *GEP = dyn_cast<GetElementPtrInst>(I)) {
		auto *VecType = cast<VectorType>(GEP->getType());
		sdesmalenUnsubmitted Done Reply Inline Actions Isn't the type of GEP guaranteed to be of type VectorType? sdesmalen: Isn't the type of GEP guaranteed to be of type VectorType?
		sdesmalenUnsubmitted Done Reply Inline Actions This condition feels a bit too restrictive, because it would avoid: %gep = getelementptr i32, i32** %ptr, i32 0, <2 x i32> <i32 4, i32 4> extractelement <2 x i32> %gep, i32 0 to not be simplified. sdesmalen:* This condition feels a bit too restrictive, because it would avoid: %gep = getelementptr i32…
		ElementCount EC = VecType->getElementCount();
		uint64_t IdxVal = IndexC ? IndexC->getZExtValue() : 0;
		if (IndexC && IdxVal < EC.getKnownMinValue() && GEP->hasOneUse()) {
		// Find out why we have a vector result - these are a few examples:
		// 1. We have a scalar pointer and a vector of indices, or
		// 2. We have a vector of pointers and a scalar index, or
		sdesmalenUnsubmitted Done Reply Inline Actions Does this need to be limited to a vector of indices that is also a splat? sdesmalen: Does this need to be limited to a vector of indices that is also a splat?
		david-armAuthorUnsubmitted Done Reply Inline Actions Sorry for not explaining this better in the previous commit message. I've tried to make it clear that I'm applying the fold unconditionall on the basis that in general a scalar GEP is still preferrable to a vector one. david-arm: Sorry for not explaining this better in the previous commit message. I've tried to make it…
		// 3. We have a vector of pointers and a vector of indices, etc.
		// Here we only consider combining when there is exactly one vector
		// operand, since the optimization is less obviously a win due to
		// needing more than one extractelements.

		unsigned VectorOps =
		llvm::count_if(GEP->operands(), [](const Value *V) {
		return isa<VectorType>(V->getType());
		});
		if (VectorOps > 1)
		CarolineConcattoUnsubmitted Done Reply Inline Actions Can you add a message when asserting? CarolineConcatto: Can you add a message when asserting?
		sdesmalenUnsubmitted Done Reply Inline Actions You can probably avoid spelling out the three possibilities and just have a loop that extracts the operand if it's type is a VectorType, as long as you make sure only one of the operands is of type VectorType. sdesmalen: You can probably avoid spelling out the three possibilities and just have a loop that extracts…
		david-armAuthorUnsubmitted Done Reply Inline Actions I've changed this to a loop, but I left in some comments as examples of different cases we might hit as I thought that might be useful to explain what's going on? david-arm: I've changed this to a loop, but I left in some comments as examples of different cases we…
		return nullptr;
		assert(VectorOps == 1 && "Expected exactly one vector GEP operand!");

		Value *NewPtr = GEP->getPointerOperand();
		if (isa<VectorType>(NewPtr->getType()))
		NewPtr = Builder.CreateExtractElement(NewPtr, IndexC);

		SmallVector<Value *> NewOps;
		for (unsigned I = 1; I != GEP->getNumOperands(); ++I) {
		Value *Op = GEP->getOperand(I);
		if (auto *OpTy = dyn_cast<VectorType>(Op->getType()))
		NewOps.push_back(Builder.CreateExtractElement(Op, IndexC));
		else
		NewOps.push_back(Op);
		sdesmalenUnsubmitted Done Reply Inline Actions nit: I think this assert is unnecessary, because we can assume the incoming IR was legal to begin with. sdesmalen: nit: I think this assert is unnecessary, because we can assume the incoming IR was legal to…
		}

		GetElementPtrInst *NewGEP = GetElementPtrInst::Create(
		cast<PointerType>(NewPtr->getType())->getElementType(), NewPtr,
		NewOps);
		NewGEP->setIsInBounds(GEP->isInBounds());
		return NewGEP;
		}
		return nullptr;
} else if (auto *SVI = dyn_cast<ShuffleVectorInst>(I)) {		} else if (auto *SVI = dyn_cast<ShuffleVectorInst>(I)) {
// If this is extracting an element from a shufflevector, figure out where		// If this is extracting an element from a shufflevector, figure out where
// it came from and extract from the appropriate input element instead.		// it came from and extract from the appropriate input element instead.
// Restrict the following transformation to fixed-length vector.		// Restrict the following transformation to fixed-length vector.
if (isa<FixedVectorType>(SVI->getType()) && isa<ConstantInt>(Index)) {		if (isa<FixedVectorType>(SVI->getType()) && isa<ConstantInt>(Index)) {
int SrcIdx =		int SrcIdx =
SVI->getMaskValue(cast<ConstantInt>(Index)->getZExtValue());		SVI->getMaskValue(cast<ConstantInt>(Index)->getZExtValue());
		sdesmalenUnsubmitted Done Reply Inline Actions unnecessary change. sdesmalen: unnecessary change.
Value *Src;		Value *Src;
unsigned LHSWidth = cast<FixedVectorType>(SVI->getOperand(0)->getType())		unsigned LHSWidth = cast<FixedVectorType>(SVI->getOperand(0)->getType())
->getNumElements();		->getNumElements();

if (SrcIdx < 0)		if (SrcIdx < 0)
return replaceInstUsesWith(EI, UndefValue::get(EI.getType()));		return replaceInstUsesWith(EI, UndefValue::get(EI.getType()));
if (SrcIdx < (int)LHSWidth)		if (SrcIdx < (int)LHSWidth)
Src = SVI->getOperand(0);		Src = SVI->getOperand(0);
▲ Show 20 Lines • Show All 2,225 Lines • Show Last 20 Lines

llvm/test/Transforms/InstCombine/gep-vector-indices.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
				; RUN: opt -instcombine %s -S \| FileCheck %s

				define i32* @vector_splat_indices_v2i64_ext0(i32* %a) {
				; CHECK-LABEL: @vector_splat_indices_v2i64_ext0(
				; CHECK-NEXT: [[RES:%.]] = getelementptr i32, i32 [[A:%.*]], i64 4
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%gep = getelementptr i32, i32* %a, <2 x i64> <i64 4, i64 4>
				%res = extractelement <2 x i32*> %gep, i32 0
				ret i32* %res
				sdesmalenUnsubmitted Done Reply Inline Actions nit: is `entry:` needed? (I don't see it used in the other tests you had to fix in this patch) sdesmalen: nit: is `entry:` needed? (I don't see it used in the other tests you had to fix in this patch)
				}

				sdesmalenUnsubmitted Done Reply Inline Actions nit: For fixed-width, this pattern is unnecessary and you can write `<2 x i64> <i64 4, i64 4>` directly in the GEP. sdesmalen: nit: For fixed-width, this pattern is unnecessary and you can write `<2 x i64> <i64 4, i64 4>`…
				define i32* @vector_splat_indices_nxv2i64_ext0(i32* %a) {
				; CHECK-LABEL: @vector_splat_indices_nxv2i64_ext0(
				; CHECK-NEXT: [[RES:%.]] = getelementptr inbounds i32, i32 [[A:%.*]], i64 extractelement (<vscale x 2 x i64> shufflevector (<vscale x 2 x i64> insertelement (<vscale x 2 x i64> poison, i64 4, i32 0), <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer), i32 0)
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%tmp = insertelement <vscale x 2 x i64> poison, i64 4, i32 0
				%splatof4 = shufflevector <vscale x 2 x i64> %tmp, <vscale x 2 x i64> poison, <vscale x 2 x i32> zeroinitializer
				%gep = getelementptr inbounds i32, i32* %a, <vscale x 2 x i64> %splatof4
				%res = extractelement <vscale x 2 x i32*> %gep, i32 0
				ret i32* %res
				}

				define i32* @vector_indices_v2i64_ext0(i32* %a, <2 x i64> %indices) {
				; CHECK-LABEL: @vector_indices_v2i64_ext0(
				; CHECK-NEXT: [[TMP0:%.]] = extractelement <2 x i64> [[INDICES:%.]], i32 0
				; CHECK-NEXT: [[RES:%.]] = getelementptr i32, i32 [[A:%.*]], i64 [[TMP0]]
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%gep = getelementptr i32, i32* %a, <2 x i64> %indices
				%res = extractelement <2 x i32*> %gep, i32 0
				ret i32* %res
				}

				define i32* @vector_indices_nxv1i64_ext0(i32* %a, <vscale x 1 x i64> %indices) {
				; CHECK-LABEL: @vector_indices_nxv1i64_ext0(
				; CHECK-NEXT: [[TMP0:%.]] = extractelement <vscale x 1 x i64> [[INDICES:%.]], i32 0
				; CHECK-NEXT: [[RES:%.]] = getelementptr i32, i32 [[A:%.*]], i64 [[TMP0]]
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%gep = getelementptr i32, i32* %a, <vscale x 1 x i64> %indices
				%res = extractelement <vscale x 1 x i32*> %gep, i32 0
				ret i32* %res
				}


				define i32* @vector_splat_ptrs_v2i64_ext0(i32* %a, i64 %index) {
				; CHECK-LABEL: @vector_splat_ptrs_v2i64_ext0(
				; CHECK-NEXT: [[RES:%.]] = getelementptr i32, i32 [[A:%.]], i64 [[INDEX:%.]]
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%tmp = insertelement <2 x i32> poison, i32 %a, i32 0
				%splatofa = shufflevector <2 x i32> %tmp, <2 x i32> poison, <2 x i32> zeroinitializer
				%gep = getelementptr i32, <2 x i32*> %splatofa, i64 %index
				%res = extractelement <2 x i32*> %gep, i32 0
				ret i32* %res
				}


				define i32* @vector_splat_ptrs_nxv2i64_ext0(i32* %a, i64 %index) {
				; CHECK-LABEL: @vector_splat_ptrs_nxv2i64_ext0(
				; CHECK-NEXT: [[TMP:%.]] = insertelement <vscale x 2 x i32> poison, i32* [[A:%.*]], i32 0
				; CHECK-NEXT: [[SPLATOFA:%.]] = shufflevector <vscale x 2 x i32> [[TMP]], <vscale x 2 x i32*> poison, <vscale x 2 x i32> zeroinitializer
				; CHECK-NEXT: [[TMP0:%.]] = extractelement <vscale x 2 x i32> [[SPLATOFA]], i32 0
				; CHECK-NEXT: [[RES:%.]] = getelementptr i32, i32 [[TMP0]], i64 [[INDEX:%.*]]
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%tmp = insertelement <vscale x 2 x i32> poison, i32 %a, i32 0
				%splatofa = shufflevector <vscale x 2 x i32> %tmp, <vscale x 2 x i32> poison, <vscale x 2 x i32> zeroinitializer
				%gep = getelementptr i32, <vscale x 2 x i32*> %splatofa, i64 %index
				%res = extractelement <vscale x 2 x i32*> %gep, i32 0
				ret i32* %res
				}


				define float* @vector_struct1_splat_indices_v4i64_ext1({float, float}* %a) {
				; CHECK-LABEL: @vector_struct1_splat_indices_v4i64_ext1(
				; CHECK-NEXT: [[RES:%.]] = getelementptr { float, float }, { float, float } [[A:%.*]], i64 4, i32 0
				; CHECK-NEXT: ret float* [[RES]]
				;
				%gep = getelementptr {float, float}, {float, float}* %a, <4 x i32> <i32 4, i32 4, i32 4, i32 4>, i32 0
				%res = extractelement <4 x float*> %gep, i32 1
				ret float* %res
				}


				define float* @vector_struct2_splat_indices_v4i64_ext1({float, [8 x float]}* %a) {
				; CHECK-LABEL: @vector_struct2_splat_indices_v4i64_ext1(
				; CHECK-NEXT: [[RES:%.]] = getelementptr { float, [8 x float] }, { float, [8 x float] } [[A:%.*]], i64 2, i32 1, i64 4
				; CHECK-NEXT: ret float* [[RES]]
				;
				CarolineConcattoUnsubmitted Done Reply Inline Actions Should we add a negative test for this too: // 3. We have a vector of pointers and a vector of indices. CarolineConcatto: Should we add a negative test for this too: // 3. We have a vector of pointers and a vector of…
				fhahnUnsubmitted Done Reply Inline Actions Do we have test cases where the GEP has other users? And where the `extractelement` has a variable index? fhahn: Do we have test cases where the GEP has other users? And where the `extractelement` has a…
				%gep = getelementptr {float, [8 x float]}, {float, [8 x float]}* %a, i32 2, i32 1, <4 x i32> <i32 4, i32 4, i32 4, i32 4>
				%res = extractelement <4 x float*> %gep, i32 1
				ret float* %res
				}


				; Negative tests

				define i32* @vector_indices_nxv2i64_ext3(i32* %a, <vscale x 2 x i64> %indices) {
				; CHECK-LABEL: @vector_indices_nxv2i64_ext3(
				; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[A:%.]], <vscale x 2 x i64> [[INDICES:%.]]
				; CHECK-NEXT: [[RES:%.]] = extractelement <vscale x 2 x i32> [[GEP]], i32 3
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%gep = getelementptr i32, i32* %a, <vscale x 2 x i64> %indices
				%res = extractelement <vscale x 2 x i32*> %gep, i32 3
				ret i32* %res
				}

				define i32* @vector_indices_nxv2i64_extN(i32* %a, <vscale x 2 x i64> %indices, i32 %N) {
				; CHECK-LABEL: @vector_indices_nxv2i64_extN(
				; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[A:%.]], <vscale x 2 x i64> [[INDICES:%.]]
				; CHECK-NEXT: [[RES:%.]] = extractelement <vscale x 2 x i32> [[GEP]], i32 [[N:%.*]]
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%gep = getelementptr i32, i32* %a, <vscale x 2 x i64> %indices
				%res = extractelement <vscale x 2 x i32*> %gep, i32 %N
				ret i32* %res
				}

				define void @vector_indices_nxv2i64_mulitple_use(i32* %a, <vscale x 2 x i64> %indices, i32 %b, i32 %c) {
				; CHECK-LABEL: @vector_indices_nxv2i64_mulitple_use(
				; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[A:%.]], <vscale x 2 x i64> [[INDICES:%.]]
				; CHECK-NEXT: [[LANE0:%.]] = extractelement <vscale x 2 x i32> [[GEP]], i32 0
				; CHECK-NEXT: [[LANE1:%.]] = extractelement <vscale x 2 x i32> [[GEP]], i32 1
				; CHECK-NEXT: store i32* [[LANE0]], i32** [[B:%.*]], align 8
				; CHECK-NEXT: store i32* [[LANE1]], i32** [[C:%.*]], align 8
				; CHECK-NEXT: ret void
				;
				%gep = getelementptr i32, i32* %a, <vscale x 2 x i64> %indices
				%lane0 = extractelement <vscale x 2 x i32*> %gep, i32 0
				%lane1 = extractelement <vscale x 2 x i32*> %gep, i32 1
				store i32* %lane0, i32** %b, align 8
				store i32* %lane1, i32** %c, align 8
				ret void
				}

				define i32* @vector_ptrs_and_indices_ext0(<vscale x 4 x i32*> %a, <vscale x 4 x i64> %indices) {
				; CHECK-LABEL: @vector_ptrs_and_indices_ext0(
				; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <vscale x 4 x i32> [[A:%.]], <vscale x 4 x i64> [[INDICES:%.]]
				; CHECK-NEXT: [[RES:%.]] = extractelement <vscale x 4 x i32> [[GEP]], i32 0
				; CHECK-NEXT: ret i32* [[RES]]
				;
				%gep = getelementptr i32, <vscale x 4 x i32*> %a, <vscale x 4 x i64> %indices
				%res = extractelement <vscale x 4 x i32*> %gep, i32 0
				ret i32* %res
				}

llvm/test/Transforms/InstCombine/vec_demanded_elts-inseltpoison.ll

Show First 20 Lines • Show All 492 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[BO:%.]] = frem reassoc ninf <3 x float> [[X:%.]], <float poison, float 2.000000e+00, float 3.000000e+00>		; CHECK-NEXT: [[BO:%.]] = frem reassoc ninf <3 x float> [[X:%.]], <float poison, float 2.000000e+00, float 3.000000e+00>
; CHECK-NEXT: [[R:%.*]] = shufflevector <3 x float> [[BO]], <3 x float> poison, <3 x i32> <i32 1, i32 undef, i32 2>		; CHECK-NEXT: [[R:%.*]] = shufflevector <3 x float> [[BO]], <3 x float> poison, <3 x i32> <i32 1, i32 undef, i32 2>
; CHECK-NEXT: ret <3 x float> [[R]]		; CHECK-NEXT: ret <3 x float> [[R]]
;		;
%bo = frem ninf reassoc <3 x float> %x, <float 1.0, float 2.0, float 3.0>		%bo = frem ninf reassoc <3 x float> %x, <float 1.0, float 2.0, float 3.0>
%r = shufflevector <3 x float> %bo, <3 x float> poison, <3 x i32> <i32 1, i32 undef, i32 2>		%r = shufflevector <3 x float> %bo, <3 x float> poison, <3 x i32> <i32 1, i32 undef, i32 2>
ret <3 x float> %r		ret <3 x float> %r
}		}

;; TODO: getelementptr tests below show missing simplifications for
;; vector demanded elements on vector geps.

define i32* @gep_vbase_w_s_idx(<2 x i32*> %base, i64 %index) {		define i32* @gep_vbase_w_s_idx(<2 x i32*> %base, i64 %index) {
		spatelUnsubmitted Not Done Reply Inline Actions Remove stale comment. spatel: Remove stale comment.
; CHECK-LABEL: @gep_vbase_w_s_idx(		; CHECK-LABEL: @gep_vbase_w_s_idx(
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <2 x i32> [[BASE:%.]], i64 [[INDEX:%.]]		; CHECK-NEXT: [[TMP1:%.]] = extractelement <2 x i32> [[BASE:%.*]], i32 1
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[TMP1]], i64 %index
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%gep = getelementptr i32, <2 x i32*> %base, i64 %index		%gep = getelementptr i32, <2 x i32*> %base, i64 %index
		spatelUnsubmitted Not Done Reply Inline Actions IIUC, this is 1 of the 2 basic patterns that we want to transform. It would be better to use different index values in the test though, so we can verify that the indexes are being translated as expected (for example, make the gep index an argument variable?). If that is a good suggestion, please commit the test change as a preliminary patch (no review needed), so we just see the functional diff from this patch here. spatel: IIUC, this is 1 of the 2 basic patterns that we want to transform. It would be better to use…
		david-armAuthorUnsubmitted Done Reply Inline Actions Hi @spatel, thanks for taking a look at the patch! I'm just not entirely clear what to do here to be honest - are you suggesting just changing `gep_vbase_w_s_idx` to take a variable index and use that instead of `1`? Or are you thinking of adding another similar test that takes a variable index? david-arm: Hi @spatel, thanks for taking a look at the patch! I'm just not entirely clear what to do here…
		spatelUnsubmitted Not Done Reply Inline Actions Yes, I'd just change the function to take a variable index. That generalizes the test without losing anything AFAICT. spatel: Yes, I'd just change the function to take a variable index. That generalizes the test without…
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}

define i32* @gep_splat_base_w_s_idx(i32* %base) {		define i32* @gep_splat_base_w_s_idx(i32* %base) {
; CHECK-LABEL: @gep_splat_base_w_s_idx(		; CHECK-LABEL: @gep_splat_base_w_s_idx(
; CHECK-NEXT: [[BASEVEC2:%.]] = insertelement <2 x i32> poison, i32* [[BASE:%.*]], i32 1		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[BASE:%.*]], i64 1
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <2 x i32> [[BASEVEC2]], i64 1
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%basevec1 = insertelement <2 x i32> poison, i32 %base, i32 0		%basevec1 = insertelement <2 x i32> poison, i32 %base, i32 0
%basevec2 = shufflevector <2 x i32> %basevec1, <2 x i32> poison, <2 x i32> zeroinitializer		%basevec2 = shufflevector <2 x i32> %basevec1, <2 x i32> poison, <2 x i32> zeroinitializer
%gep = getelementptr i32, <2 x i32*> %basevec2, i64 1		%gep = getelementptr i32, <2 x i32*> %basevec2, i64 1
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}
Show All 27 Lines	;
ret i32* %ee		ret i32* %ee
}		}


@GLOBAL = internal global i32 zeroinitializer		@GLOBAL = internal global i32 zeroinitializer

define i32* @gep_cvbase_w_s_idx(<2 x i32*> %base, i64 %raw_addr) {		define i32* @gep_cvbase_w_s_idx(<2 x i32*> %base, i64 %raw_addr) {
; CHECK-LABEL: @gep_cvbase_w_s_idx(		; CHECK-LABEL: @gep_cvbase_w_s_idx(
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <2 x i32> <i32* poison, i32* @GLOBAL>, i64 [[RAW_ADDR:%.*]]		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 @GLOBAL, i64 [[RAW_ADDR:%.*]]
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, i64 %raw_addr		%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, i64 %raw_addr
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}

define i32* @gep_cvbase_w_cv_idx(<2 x i32*> %base, i64 %raw_addr) {		define i32* @gep_cvbase_w_cv_idx(<2 x i32*> %base, i64 %raw_addr) {
; CHECK-LABEL: @gep_cvbase_w_cv_idx(		; CHECK-LABEL: @gep_cvbase_w_cv_idx(
; CHECK-NEXT: ret i32* getelementptr inbounds (i32, i32* @GLOBAL, i64 1)		; CHECK-NEXT: ret i32* getelementptr inbounds (i32, i32* @GLOBAL, i64 1)
;		;
%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, <2 x i64> <i64 0, i64 1>		%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, <2 x i64> <i64 0, i64 1>
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}


define i32* @gep_sbase_w_cv_idx(i32* %base) {		define i32* @gep_sbase_w_cv_idx(i32* %base) {
; CHECK-LABEL: @gep_sbase_w_cv_idx(		; CHECK-LABEL: @gep_sbase_w_cv_idx(
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[BASE:%.*]], <2 x i64> <i64 poison, i64 1>		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[BASE:%.*]], i64 1
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%gep = getelementptr i32, i32* %base, <2 x i64> <i64 0, i64 1>		%gep = getelementptr i32, i32* %base, <2 x i64> <i64 0, i64 1>
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}

define i32* @gep_sbase_w_splat_idx(i32* %base, i64 %idx) {		define i32* @gep_sbase_w_splat_idx(i32* %base, i64 %idx) {
; CHECK-LABEL: @gep_sbase_w_splat_idx(		; CHECK-LABEL: @gep_sbase_w_splat_idx(
; CHECK-NEXT: [[IDXVEC2:%.]] = insertelement <2 x i64> poison, i64 [[IDX:%.]], i32 1		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[BASE:%.]], i64 [[IDX:%.]]
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[BASE:%.*]], <2 x i64> [[IDXVEC2]]
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%idxvec1 = insertelement <2 x i64> poison, i64 %idx, i32 0		%idxvec1 = insertelement <2 x i64> poison, i64 %idx, i32 0
%idxvec2 = shufflevector <2 x i64> %idxvec1, <2 x i64> poison, <2 x i32> zeroinitializer		%idxvec2 = shufflevector <2 x i64> %idxvec1, <2 x i64> poison, <2 x i32> zeroinitializer
%gep = getelementptr i32, i32* %base, <2 x i64> %idxvec2		%gep = getelementptr i32, i32* %base, <2 x i64> %idxvec2
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}
▲ Show 20 Lines • Show All 244 Lines • Show Last 20 Lines

llvm/test/Transforms/InstCombine/vec_demanded_elts.ll

Show First 20 Lines • Show All 493 Lines • ▼ Show 20 Lines
; CHECK-NEXT: [[R:%.*]] = shufflevector <3 x float> [[BO]], <3 x float> undef, <3 x i32> <i32 1, i32 undef, i32 2>		; CHECK-NEXT: [[R:%.*]] = shufflevector <3 x float> [[BO]], <3 x float> undef, <3 x i32> <i32 1, i32 undef, i32 2>
; CHECK-NEXT: ret <3 x float> [[R]]		; CHECK-NEXT: ret <3 x float> [[R]]
;		;
%bo = frem ninf reassoc <3 x float> %x, <float 1.0, float 2.0, float 3.0>		%bo = frem ninf reassoc <3 x float> %x, <float 1.0, float 2.0, float 3.0>
%r = shufflevector <3 x float> %bo, <3 x float> undef, <3 x i32> <i32 1, i32 undef, i32 2>		%r = shufflevector <3 x float> %bo, <3 x float> undef, <3 x i32> <i32 1, i32 undef, i32 2>
ret <3 x float> %r		ret <3 x float> %r
}		}

;; TODO: getelementptr tests below show missing simplifications for
;; vector demanded elements on vector geps.

define i32* @gep_vbase_w_s_idx(<2 x i32*> %base, i64 %index) {		define i32* @gep_vbase_w_s_idx(<2 x i32*> %base, i64 %index) {
; CHECK-LABEL: @gep_vbase_w_s_idx(		; CHECK-LABEL: @gep_vbase_w_s_idx(
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <2 x i32> [[BASE:%.]], i64 [[INDEX:%.]]		; CHECK-NEXT: [[TMP1:%.]] = extractelement <2 x i32> [[BASE:%.*]], i32 1
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[TMP1]], i64 %index
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%gep = getelementptr i32, <2 x i32*> %base, i64 %index		%gep = getelementptr i32, <2 x i32*> %base, i64 %index
		spatelUnsubmitted Not Done Reply Inline Actions This test file is the pre-poison equivalent of the other one, so see earlier test comments. spatel: This test file is the pre-poison equivalent of the other one, so see earlier test comments.
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}

define i32* @gep_splat_base_w_s_idx(i32* %base) {		define i32* @gep_splat_base_w_s_idx(i32* %base) {
; CHECK-LABEL: @gep_splat_base_w_s_idx(		; CHECK-LABEL: @gep_splat_base_w_s_idx(
; CHECK-NEXT: [[BASEVEC2:%.]] = insertelement <2 x i32> undef, i32* [[BASE:%.*]], i32 1		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[BASE:%.*]], i64 1
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <2 x i32> [[BASEVEC2]], i64 1
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%basevec1 = insertelement <2 x i32> undef, i32 %base, i32 0		%basevec1 = insertelement <2 x i32> undef, i32 %base, i32 0
%basevec2 = shufflevector <2 x i32> %basevec1, <2 x i32> undef, <2 x i32> zeroinitializer		%basevec2 = shufflevector <2 x i32> %basevec1, <2 x i32> undef, <2 x i32> zeroinitializer
%gep = getelementptr i32, <2 x i32*> %basevec2, i64 1		%gep = getelementptr i32, <2 x i32*> %basevec2, i64 1
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}
Show All 27 Lines	;
ret i32* %ee		ret i32* %ee
}		}


@GLOBAL = internal global i32 zeroinitializer		@GLOBAL = internal global i32 zeroinitializer

define i32* @gep_cvbase_w_s_idx(<2 x i32*> %base, i64 %raw_addr) {		define i32* @gep_cvbase_w_s_idx(<2 x i32*> %base, i64 %raw_addr) {
; CHECK-LABEL: @gep_cvbase_w_s_idx(		; CHECK-LABEL: @gep_cvbase_w_s_idx(
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, <2 x i32> <i32* poison, i32* @GLOBAL>, i64 [[RAW_ADDR:%.*]]		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 @GLOBAL, i64 [[RAW_ADDR:%.*]]
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, i64 %raw_addr		%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, i64 %raw_addr
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}

define i32* @gep_cvbase_w_cv_idx(<2 x i32*> %base, i64 %raw_addr) {		define i32* @gep_cvbase_w_cv_idx(<2 x i32*> %base, i64 %raw_addr) {
; CHECK-LABEL: @gep_cvbase_w_cv_idx(		; CHECK-LABEL: @gep_cvbase_w_cv_idx(
; CHECK-NEXT: ret i32* getelementptr inbounds (i32, i32* @GLOBAL, i64 1)		; CHECK-NEXT: ret i32* getelementptr inbounds (i32, i32* @GLOBAL, i64 1)
;		;
%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, <2 x i64> <i64 0, i64 1>		%gep = getelementptr i32, <2 x i32> <i32 @GLOBAL, i32* @GLOBAL>, <2 x i64> <i64 0, i64 1>
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}


define i32* @gep_sbase_w_cv_idx(i32* %base) {		define i32* @gep_sbase_w_cv_idx(i32* %base) {
; CHECK-LABEL: @gep_sbase_w_cv_idx(		; CHECK-LABEL: @gep_sbase_w_cv_idx(
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[BASE:%.*]], <2 x i64> <i64 poison, i64 1>		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[BASE:%.*]], i64 1
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%gep = getelementptr i32, i32* %base, <2 x i64> <i64 0, i64 1>		%gep = getelementptr i32, i32* %base, <2 x i64> <i64 0, i64 1>
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}

define i32* @gep_sbase_w_splat_idx(i32* %base, i64 %idx) {		define i32* @gep_sbase_w_splat_idx(i32* %base, i64 %idx) {
; CHECK-LABEL: @gep_sbase_w_splat_idx(		; CHECK-LABEL: @gep_sbase_w_splat_idx(
; CHECK-NEXT: [[IDXVEC2:%.]] = insertelement <2 x i64> undef, i64 [[IDX:%.]], i32 1		; CHECK-NEXT: [[EE:%.]] = getelementptr i32, i32 [[BASE:%.]], i64 [[IDX:%.]]
; CHECK-NEXT: [[GEP:%.]] = getelementptr i32, i32 [[BASE:%.*]], <2 x i64> [[IDXVEC2]]
; CHECK-NEXT: [[EE:%.]] = extractelement <2 x i32> [[GEP]], i32 1
; CHECK-NEXT: ret i32* [[EE]]		; CHECK-NEXT: ret i32* [[EE]]
;		;
%idxvec1 = insertelement <2 x i64> undef, i64 %idx, i32 0		%idxvec1 = insertelement <2 x i64> undef, i64 %idx, i32 0
%idxvec2 = shufflevector <2 x i64> %idxvec1, <2 x i64> undef, <2 x i32> zeroinitializer		%idxvec2 = shufflevector <2 x i64> %idxvec1, <2 x i64> undef, <2 x i32> zeroinitializer
%gep = getelementptr i32, i32* %base, <2 x i64> %idxvec2		%gep = getelementptr i32, i32* %base, <2 x i64> %idxvec2
%ee = extractelement <2 x i32*> %gep, i32 1		%ee = extractelement <2 x i32*> %gep, i32 1
ret i32* %ee		ret i32* %ee
}		}
▲ Show 20 Lines • Show All 244 Lines • Show Last 20 Lines

llvm/test/Transforms/InstCombine/vec_gep_scalar_arg-inseltpoison.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -instcombine -S < %s \| FileCheck %s			; RUN: opt -instcombine -S < %s \| FileCheck %s

	define <4 x i16> @PR41270([4 x i16] %x) {			define <4 x i16> @PR41270([4 x i16] %x) {
	; CHECK-LABEL: @PR41270(			; CHECK-LABEL: @PR41270(
	; CHECK-NEXT: [[TMP1:%.]] = insertelement <4 x [4 x i16]> undef, [4 x i16]* [[X:%.*]], i32 0			; CHECK-NEXT: [[T3:%.]] = getelementptr inbounds [4 x i16], [4 x i16] [[X:%.*]], i64 0, i64 3
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds [4 x i16], <4 x [4 x i16]> [[TMP1]], i64 0, i64 3			; CHECK-NEXT: [[INS2:%.]] = insertelement <4 x i16> poison, i16* [[T3]], i32 0
	; CHECK-NEXT: ret <4 x i16*> [[TMP2]]			; CHECK-NEXT: ret <4 x i16*> [[INS2]]
	;			;
	%ins = insertelement <4 x [4 x i16]> poison, [4 x i16] %x, i32 0			%ins = insertelement <4 x [4 x i16]> poison, [4 x i16] %x, i32 0
	%splat = shufflevector <4 x [4 x i16]> %ins, <4 x [4 x i16]> poison, <4 x i32> zeroinitializer			%splat = shufflevector <4 x [4 x i16]> %ins, <4 x [4 x i16]> poison, <4 x i32> zeroinitializer
	%t2 = getelementptr inbounds [4 x i16], <4 x [4 x i16]*> %splat, i32 0, i32 3			%t2 = getelementptr inbounds [4 x i16], <4 x [4 x i16]*> %splat, i32 0, i32 3
	%t3 = extractelement <4 x i16*> %t2, i32 3			%t3 = extractelement <4 x i16*> %t2, i32 3
	%ins2 = insertelement <4 x i16> poison, i16 %t3, i32 0			%ins2 = insertelement <4 x i16> poison, i16 %t3, i32 0
	ret <4 x i16*> %ins2			ret <4 x i16*> %ins2
	}			}

llvm/test/Transforms/InstCombine/vec_gep_scalar_arg.ll

	; NOTE: Assertions have been autogenerated by utils/update_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
	; RUN: opt -instcombine -S < %s \| FileCheck %s			; RUN: opt -instcombine -S < %s \| FileCheck %s

	define <4 x i16> @PR41270([4 x i16] %x) {			define <4 x i16> @PR41270([4 x i16] %x) {
	; CHECK-LABEL: @PR41270(			; CHECK-LABEL: @PR41270(
	; CHECK-NEXT: [[TMP1:%.]] = insertelement <4 x [4 x i16]> undef, [4 x i16]* [[X:%.*]], i32 0			; CHECK-NEXT: [[T3:%.]] = getelementptr inbounds [4 x i16], [4 x i16] [[X:%.*]], i64 0, i64 3
	; CHECK-NEXT: [[TMP2:%.]] = getelementptr inbounds [4 x i16], <4 x [4 x i16]> [[TMP1]], i64 0, i64 3			; CHECK-NEXT: [[INS2:%.]] = insertelement <4 x i16> undef, i16* [[T3]], i32 0
	; CHECK-NEXT: ret <4 x i16*> [[TMP2]]			; CHECK-NEXT: ret <4 x i16*> [[INS2]]
	;			;
	%ins = insertelement <4 x [4 x i16]> undef, [4 x i16] %x, i32 0			%ins = insertelement <4 x [4 x i16]> undef, [4 x i16] %x, i32 0
	%splat = shufflevector <4 x [4 x i16]> %ins, <4 x [4 x i16]> undef, <4 x i32> zeroinitializer			%splat = shufflevector <4 x [4 x i16]> %ins, <4 x [4 x i16]> undef, <4 x i32> zeroinitializer
	%t2 = getelementptr inbounds [4 x i16], <4 x [4 x i16]*> %splat, i32 0, i32 3			%t2 = getelementptr inbounds [4 x i16], <4 x [4 x i16]*> %splat, i32 0, i32 3
	%t3 = extractelement <4 x i16*> %t2, i32 3			%t3 = extractelement <4 x i16*> %t2, i32 3
	%ins2 = insertelement <4 x i16> undef, i16 %t3, i32 0			%ins2 = insertelement <4 x i16> undef, i16 %t3, i32 0
	ret <4 x i16*> %ins2			ret <4 x i16*> %ins2
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[InstCombine] Fold extractelement + vector GEP with one use
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 347865

llvm/lib/Transforms/InstCombine/InstCombineVectorOps.cpp

llvm/test/Transforms/InstCombine/gep-vector-indices.ll

llvm/test/Transforms/InstCombine/vec_demanded_elts-inseltpoison.ll

llvm/test/Transforms/InstCombine/vec_demanded_elts.ll

llvm/test/Transforms/InstCombine/vec_gep_scalar_arg-inseltpoison.ll

llvm/test/Transforms/InstCombine/vec_gep_scalar_arg.ll

This is an archive of the discontinued LLVM Phabricator instance.

[InstCombine] Fold extractelement + vector GEP with one useClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 347865

llvm/lib/Transforms/InstCombine/InstCombineVectorOps.cpp

llvm/test/Transforms/InstCombine/gep-vector-indices.ll

llvm/test/Transforms/InstCombine/vec_demanded_elts-inseltpoison.ll

llvm/test/Transforms/InstCombine/vec_demanded_elts.ll

llvm/test/Transforms/InstCombine/vec_gep_scalar_arg-inseltpoison.ll

llvm/test/Transforms/InstCombine/vec_gep_scalar_arg.ll

[InstCombine] Fold extractelement + vector GEP with one use
ClosedPublic