Diff 271548

llvm/lib/Target/PowerPC/PPCISelLowering.h

Show First 20 Lines • Show All 1,097 Lines • ▼ Show 20 Lines	private:
SDValue LowerREM(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerREM(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerBSWAP(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerBSWAP(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerATOMIC_CMP_SWAP(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerATOMIC_CMP_SWAP(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerSCALAR_TO_VECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerSCALAR_TO_VECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerMUL(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerMUL(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerABS(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerABS(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerROTL(SDValue Op, SelectionDAG &DAG) const;

SDValue LowerVectorLoad(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVectorLoad(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerVectorStore(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVectorStore(SDValue Op, SelectionDAG &DAG) const;

SDValue LowerCallResult(SDValue Chain, SDValue InFlag,		SDValue LowerCallResult(SDValue Chain, SDValue InFlag,
CallingConv::ID CallConv, bool isVarArg,		CallingConv::ID CallConv, bool isVarArg,
const SmallVectorImpl<ISD::InputArg> &Ins,		const SmallVectorImpl<ISD::InputArg> &Ins,
const SDLoc &dl, SelectionDAG &DAG,		const SDLoc &dl, SelectionDAG &DAG,
▲ Show 20 Lines • Show All 154 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 771 Lines • ▼ Show 20 Lines	if (Subtarget.hasAltivec()) {
setOperationAction(ISD::FTRUNC, MVT::v4f32, Legal);		setOperationAction(ISD::FTRUNC, MVT::v4f32, Legal);
setOperationAction(ISD::FNEARBYINT, MVT::v4f32, Legal);		setOperationAction(ISD::FNEARBYINT, MVT::v4f32, Legal);

// Without hasP8Altivec set, v2i64 SMAX isn't available.		// Without hasP8Altivec set, v2i64 SMAX isn't available.
// But ABS custom lowering requires SMAX support.		// But ABS custom lowering requires SMAX support.
if (!Subtarget.hasP8Altivec())		if (!Subtarget.hasP8Altivec())
setOperationAction(ISD::ABS, MVT::v2i64, Expand);		setOperationAction(ISD::ABS, MVT::v2i64, Expand);

		// Custom lowering ROTL v1i128 to VECTOR_SHUFFLE v16i8.
		setOperationAction(ISD::ROTL, MVT::v1i128, Custom);
// With hasAltivec set, we can lower ISD::ROTL to vrl(b\|h\|w).		// With hasAltivec set, we can lower ISD::ROTL to vrl(b\|h\|w).
if (Subtarget.hasAltivec())		if (Subtarget.hasAltivec())
for (auto VT : {MVT::v4i32, MVT::v8i16, MVT::v16i8})		for (auto VT : {MVT::v4i32, MVT::v8i16, MVT::v16i8})
setOperationAction(ISD::ROTL, VT, Legal);		setOperationAction(ISD::ROTL, VT, Legal);
// With hasP8Altivec set, we can lower ISD::ROTL to vrld.		// With hasP8Altivec set, we can lower ISD::ROTL to vrld.
if (Subtarget.hasP8Altivec())		if (Subtarget.hasP8Altivec())
setOperationAction(ISD::ROTL, MVT::v2i64, Legal);		setOperationAction(ISD::ROTL, MVT::v2i64, Legal);

▲ Show 20 Lines • Show All 8,824 Lines • ▼ Show 20 Lines	if (V2.isUndef()) {
(MaskOneElt < NumHalfWords) ? OriginalOrderHigh : OriginalOrderLow;		(MaskOneElt < NumHalfWords) ? OriginalOrderHigh : OriginalOrderLow;
// Skip if mask of other elements don't equal our expected order.		// Skip if mask of other elements don't equal our expected order.
if ((Mask & MaskOtherElts) == (TargetOrder & MaskOtherElts)) {		if ((Mask & MaskOtherElts) == (TargetOrder & MaskOtherElts)) {
// We only need the last 3 bits for the number of shifts.		// We only need the last 3 bits for the number of shifts.
ShiftElts = IsLE ? LittleEndianShifts[MaskOneElt & 0x7]		ShiftElts = IsLE ? LittleEndianShifts[MaskOneElt & 0x7]
: BigEndianShifts[MaskOneElt & 0x7];		: BigEndianShifts[MaskOneElt & 0x7];
InsertAtByte = IsLE ? BytesInVector - (i + 1) * 2 : i * 2;		InsertAtByte = IsLE ? BytesInVector - (i + 1) * 2 : i * 2;
Swap = MaskOneElt < NumHalfWords;		Swap = MaskOneElt < NumHalfWords;
FoundCandidate = true;		FoundCandidate = true;
		steven.zhangUnsubmitted Done Reply Inline Actions It will have problem if return SDValue() when lower the ROTL. I would change it as assertion. steven.zhang: It will have problem if return SDValue() when lower the ROTL. I would change it as assertion.
		shawnlUnsubmitted Done Reply Inline Actions `assert(Op.getValueType() == MVT::v1i128 && "unexpected MVP type")` shawnl: `assert(Op.getValueType() == MVT::v1i128 && "unexpected MVP type")`
		EsmeAuthorUnsubmitted Done Reply Inline Actions Thx~ assertions have been added. Esme: Thx~ assertions have been added.
break;		break;
}		}
		lkailUnsubmitted Done Reply Inline Actions I suppose we still need to peekThroughBitcasts Op0. lkail: I suppose we still need to peekThroughBitcasts Op0.
		EsmeAuthorUnsubmitted Done Reply Inline Actions Thanks for reminding. Esme: Thanks for reminding.
}		}
}		}

if (!FoundCandidate)		if (!FoundCandidate)
		lkailUnsubmitted Done Reply Inline Actions Can we use `std::iota` and `std::rotate` to simplify such simulated rotation? lkail: Can we use `std::iota` and `std::rotate` to simplify such simulated rotation?
return SDValue();		return SDValue();

// Candidate found, construct the proper SDAG sequence with VINSERTH,		// Candidate found, construct the proper SDAG sequence with VINSERTH,
// optionally with VECSHL if shift is required.		// optionally with VECSHL if shift is required.
if (Swap)		if (Swap)
std::swap(V1, V2);		std::swap(V1, V2);
		steven.zhangUnsubmitted Done Reply Inline Actions nit: if (SDValue Shuffle = xxxx) return Shuffle; steven.zhang: nit: if (SDValue Shuffle = xxxx) return Shuffle;
if (V2.isUndef())		if (V2.isUndef())
V2 = V1;		V2 = V1;
SDValue Conv1 = DAG.getNode(ISD::BITCAST, dl, MVT::v8i16, V1);		SDValue Conv1 = DAG.getNode(ISD::BITCAST, dl, MVT::v8i16, V1);
if (ShiftElts) {		if (ShiftElts) {
// Double ShiftElts because we're left shifting on v16i8 type.		// Double ShiftElts because we're left shifting on v16i8 type.
SDValue Shl = DAG.getNode(PPCISD::VECSHL, dl, MVT::v16i8, V2, V2,		SDValue Shl = DAG.getNode(PPCISD::VECSHL, dl, MVT::v16i8, V2, V2,
DAG.getConstant(2 * ShiftElts, dl, MVT::i32));		DAG.getConstant(2 * ShiftElts, dl, MVT::i32));
SDValue Conv2 = DAG.getNode(ISD::BITCAST, dl, MVT::v8i16, Shl);		SDValue Conv2 = DAG.getNode(ISD::BITCAST, dl, MVT::v8i16, Shl);
SDValue Ins = DAG.getNode(PPCISD::VECINSERT, dl, MVT::v8i16, Conv1, Conv2,		SDValue Ins = DAG.getNode(PPCISD::VECINSERT, dl, MVT::v8i16, Conv1, Conv2,
DAG.getConstant(InsertAtByte, dl, MVT::i32));		DAG.getConstant(InsertAtByte, dl, MVT::i32));
return DAG.getNode(ISD::BITCAST, dl, MVT::v16i8, Ins);		return DAG.getNode(ISD::BITCAST, dl, MVT::v16i8, Ins);
}		}
SDValue Conv2 = DAG.getNode(ISD::BITCAST, dl, MVT::v8i16, V2);		SDValue Conv2 = DAG.getNode(ISD::BITCAST, dl, MVT::v8i16, V2);
SDValue Ins = DAG.getNode(PPCISD::VECINSERT, dl, MVT::v8i16, Conv1, Conv2,		SDValue Ins = DAG.getNode(PPCISD::VECINSERT, dl, MVT::v8i16, Conv1, Conv2,
DAG.getConstant(InsertAtByte, dl, MVT::i32));		DAG.getConstant(InsertAtByte, dl, MVT::i32));
return DAG.getNode(ISD::BITCAST, dl, MVT::v16i8, Ins);		return DAG.getNode(ISD::BITCAST, dl, MVT::v16i8, Ins);
}		}

		/// LowerROTL - Custom lowering for ROTL(v1i128) to vector_shuffle(v16i8).
		/// We lower ROTL(v1i128) to vector_shuffle(v16i8) only if shift amount is
		/// a multiple of 8. Otherwise convert it to a scalar rotation(i128)
		/// i.e (or (shl x, C1), (srl x, 128-C1)).
		SDValue PPCTargetLowering::LowerROTL(SDValue Op, SelectionDAG &DAG) const {
		assert(Op.getOpcode() == ISD::ROTL && "Should only be called for ISD::ROTL");
		assert(Op.getValueType() == MVT::v1i128 &&
		"Only set v1i128 as custom, other type shouldn't reach here!");
		SDLoc dl(Op);
		SDValue N0 = peekThroughBitcasts(Op.getOperand(0));
		SDValue N1 = peekThroughBitcasts(Op.getOperand(1));
		unsigned SHLAmt = N1.getConstantOperandVal(0);
		if (SHLAmt % 8 == 0) {
		SmallVector<int, 16> Mask(16, 0);
		std::iota(Mask.begin(), Mask.end(), 0);
		std::rotate(Mask.begin(), Mask.begin() + SHLAmt / 8, Mask.end());
		if (SDValue Shuffle =
		DAG.getVectorShuffle(MVT::v16i8, dl, DAG.getBitcast(MVT::v16i8, N0),
		DAG.getUNDEF(MVT::v16i8), Mask))
		return DAG.getNode(ISD::BITCAST, dl, MVT::v1i128, Shuffle);
		}
		SDValue ArgVal = DAG.getBitcast(MVT::i128, N0);
		SDValue SHLOp = DAG.getNode(ISD::SHL, dl, MVT::i128, ArgVal,
		DAG.getConstant(SHLAmt, dl, MVT::i32));
		SDValue SRLOp = DAG.getNode(ISD::SRL, dl, MVT::i128, ArgVal,
		DAG.getConstant(128 - SHLAmt, dl, MVT::i32));
		SDValue OROp = DAG.getNode(ISD::OR, dl, MVT::i128, SHLOp, SRLOp);
		return DAG.getNode(ISD::BITCAST, dl, MVT::v1i128, OROp);
		}

/// LowerVECTOR_SHUFFLE - Return the code we lower for VECTOR_SHUFFLE. If this		/// LowerVECTOR_SHUFFLE - Return the code we lower for VECTOR_SHUFFLE. If this
/// is a shuffle we can handle in a single instruction, return it. Otherwise,		/// is a shuffle we can handle in a single instruction, return it. Otherwise,
/// return the code it can be lowered into. Worst case, it can always be		/// return the code it can be lowered into. Worst case, it can always be
/// lowered into a vperm.		/// lowered into a vperm.
SDValue PPCTargetLowering::LowerVECTOR_SHUFFLE(SDValue Op,		SDValue PPCTargetLowering::LowerVECTOR_SHUFFLE(SDValue Op,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
SDLoc dl(Op);		SDLoc dl(Op);
SDValue V1 = Op.getOperand(0);		SDValue V1 = Op.getOperand(0);
▲ Show 20 Lines • Show All 1,265 Lines • ▼ Show 20 Lines	SDValue PPCTargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
case ISD::VECTOR_SHUFFLE: return LowerVECTOR_SHUFFLE(Op, DAG);		case ISD::VECTOR_SHUFFLE: return LowerVECTOR_SHUFFLE(Op, DAG);
case ISD::INTRINSIC_WO_CHAIN: return LowerINTRINSIC_WO_CHAIN(Op, DAG);		case ISD::INTRINSIC_WO_CHAIN: return LowerINTRINSIC_WO_CHAIN(Op, DAG);
case ISD::SCALAR_TO_VECTOR: return LowerSCALAR_TO_VECTOR(Op, DAG);		case ISD::SCALAR_TO_VECTOR: return LowerSCALAR_TO_VECTOR(Op, DAG);
case ISD::EXTRACT_VECTOR_ELT: return LowerEXTRACT_VECTOR_ELT(Op, DAG);		case ISD::EXTRACT_VECTOR_ELT: return LowerEXTRACT_VECTOR_ELT(Op, DAG);
case ISD::INSERT_VECTOR_ELT: return LowerINSERT_VECTOR_ELT(Op, DAG);		case ISD::INSERT_VECTOR_ELT: return LowerINSERT_VECTOR_ELT(Op, DAG);
case ISD::MUL: return LowerMUL(Op, DAG);		case ISD::MUL: return LowerMUL(Op, DAG);
case ISD::ABS: return LowerABS(Op, DAG);		case ISD::ABS: return LowerABS(Op, DAG);
case ISD::FP_EXTEND: return LowerFP_EXTEND(Op, DAG);		case ISD::FP_EXTEND: return LowerFP_EXTEND(Op, DAG);
		case ISD::ROTL: return LowerROTL(Op, DAG);

// For counter-based loop handling.		// For counter-based loop handling.
case ISD::INTRINSIC_W_CHAIN: return SDValue();		case ISD::INTRINSIC_W_CHAIN: return SDValue();

case ISD::BITCAST: return LowerBITCAST(Op, DAG);		case ISD::BITCAST: return LowerBITCAST(Op, DAG);

// Frame & Return address.		// Frame & Return address.
case ISD::RETURNADDR: return LowerRETURNADDR(Op, DAG);		case ISD::RETURNADDR: return LowerRETURNADDR(Op, DAG);
▲ Show 20 Lines • Show All 5,566 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/pr45628.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr \			; RUN: llc -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr \
	; RUN: -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs < %s \| FileCheck %s \			; RUN: -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs < %s \| FileCheck %s \
	; RUN: -check-prefix=CHECK-VSX			; RUN: -check-prefix=P9-VSX
	; RUN: llc -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr \			; RUN: llc -mcpu=pwr9 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr \
	; RUN: -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs -mattr=-vsx < %s \| FileCheck %s \			; RUN: -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs -mattr=-vsx < %s \| FileCheck %s \
	; RUN: -check-prefix=CHECK-NOVSX			; RUN: -check-prefix=P9-NOVSX
				; RUN: llc -mcpu=pwr8 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr \
				; RUN: -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs < %s \| FileCheck %s \
				; RUN: -check-prefix=P8-VSX
				; RUN: llc -mcpu=pwr8 -ppc-asm-full-reg-names -ppc-vsr-nums-as-vr \
				; RUN: -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs -mattr=-vsx < %s \| FileCheck %s \
				; RUN: -check-prefix=P8-NOVSX

	define <1 x i128> @rotl_64(<1 x i128> %num) {			define <1 x i128> @rotl_64(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_64:			; P9-VSX-LABEL: rotl_64:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; P9-VSX-NEXT: xxswapd v2, v2
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI0_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-LABEL: rotl_64:
	; CHECK-VSX-NEXT: vspltb v5, v3, 15			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vsro v2, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 8
	; CHECK-VSX-NEXT: vsl v4, v4, v5			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsr v2, v2, v5			;
	; CHECK-VSX-NEXT: xxlor v2, v4, v2			; P8-VSX-LABEL: rotl_64:
	; CHECK-VSX-NEXT: blr			; P8-VSX: # %bb.0: # %entry
	;			; P8-VSX-NEXT: xxswapd v2, v2
	; CHECK-NOVSX-LABEL: rotl_64:			; P8-VSX-NEXT: blr
	; CHECK-NOVSX: # %bb.0: # %entry			;
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI0_0@toc@ha			; P8-NOVSX-LABEL: rotl_64:
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI0_0@toc@l			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 8
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: vspltb v5, v3, 15
	; CHECK-NOVSX-NEXT: vsro v2, v2, v3
	; CHECK-NOVSX-NEXT: vsl v4, v4, v5
	; CHECK-NOVSX-NEXT: vsr v2, v2, v5
	; CHECK-NOVSX-NEXT: vor v2, v4, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 64>			%shl = shl <1 x i128> %num, <i128 64>
	%shr = lshr <1 x i128> %num, <i128 64>			%shr = lshr <1 x i128> %num, <i128 64>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_32(<1 x i128> %num) {			define <1 x i128> @rotl_32(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_32:			; P9-VSX-LABEL: rotl_32:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI1_0@toc@ha			; P9-VSX-NEXT: xxsldwi v2, v2, v2, 3
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI1_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI1_1@toc@ha			; P9-NOVSX-LABEL: rotl_32:
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI1_1@toc@l			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 12
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsl v3, v4, v3			;
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P8-VSX-LABEL: rotl_32:
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: xxsldwi v2, v2, v2, 3
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: blr
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			;
	; CHECK-VSX-NEXT: blr			; P8-NOVSX-LABEL: rotl_32:
	;			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-LABEL: rotl_32:			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 12
	; CHECK-NOVSX: # %bb.0: # %entry			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI1_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI1_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI1_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI1_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 32>			%shl = shl <1 x i128> %num, <i128 32>
	%shr = lshr <1 x i128> %num, <i128 96>			%shr = lshr <1 x i128> %num, <i128 96>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_96(<1 x i128> %num) {			define <1 x i128> @rotl_96(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_96:			; P9-VSX-LABEL: rotl_96:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI2_0@toc@ha			; P9-VSX-NEXT: xxsldwi v2, v2, v2, 1
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI2_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI2_1@toc@ha			; P9-NOVSX-LABEL: rotl_96:
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI2_1@toc@l			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 4
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsl v3, v4, v3			;
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P8-VSX-LABEL: rotl_96:
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: xxsldwi v2, v2, v2, 1
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: blr
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			;
	; CHECK-VSX-NEXT: blr			; P8-NOVSX-LABEL: rotl_96:
	;			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-LABEL: rotl_96:			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 4
	; CHECK-NOVSX: # %bb.0: # %entry			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI2_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI2_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI2_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI2_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 96>			%shl = shl <1 x i128> %num, <i128 96>
	%shr = lshr <1 x i128> %num, <i128 32>			%shr = lshr <1 x i128> %num, <i128 32>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_16(<1 x i128> %num) {			define <1 x i128> @rotl_16(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_16:			; P9-VSX-LABEL: rotl_16:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI3_0@toc@ha			; P9-VSX-NEXT: vsldoi v2, v2, v2, 14
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI3_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI3_1@toc@ha			; P9-NOVSX-LABEL: rotl_16:
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI3_1@toc@l			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 14
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsl v3, v4, v3			;
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P8-VSX-LABEL: rotl_16:
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: vsldoi v2, v2, v2, 14
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: blr
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			;
	; CHECK-VSX-NEXT: blr			; P8-NOVSX-LABEL: rotl_16:
	;			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-LABEL: rotl_16:			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 14
	; CHECK-NOVSX: # %bb.0: # %entry			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI3_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI3_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI3_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI3_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 16>			%shl = shl <1 x i128> %num, <i128 16>
	%shr = lshr <1 x i128> %num, <i128 112>			%shr = lshr <1 x i128> %num, <i128 112>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_112(<1 x i128> %num) {			define <1 x i128> @rotl_112(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_112:			; P9-VSX-LABEL: rotl_112:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI4_0@toc@ha			; P9-VSX-NEXT: vsldoi v2, v2, v2, 2
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI4_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI4_1@toc@ha			; P9-NOVSX-LABEL: rotl_112:
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI4_1@toc@l			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 2
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsl v3, v4, v3			;
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P8-VSX-LABEL: rotl_112:
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: vsldoi v2, v2, v2, 2
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: blr
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			;
	; CHECK-VSX-NEXT: blr			; P8-NOVSX-LABEL: rotl_112:
	;			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-LABEL: rotl_112:			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 2
	; CHECK-NOVSX: # %bb.0: # %entry			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI4_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI4_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI4_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI4_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 112>			%shl = shl <1 x i128> %num, <i128 112>
	%shr = lshr <1 x i128> %num, <i128 16>			%shr = lshr <1 x i128> %num, <i128 16>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_8(<1 x i128> %num) {			define <1 x i128> @rotl_8(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_8:			; P9-VSX-LABEL: rotl_8:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI5_0@toc@ha			; P9-VSX-NEXT: vsldoi v2, v2, v2, 15
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI5_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI5_1@toc@ha			; P9-NOVSX-LABEL: rotl_8:
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI5_1@toc@l			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 15
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsl v3, v4, v3			;
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P8-VSX-LABEL: rotl_8:
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: vsldoi v2, v2, v2, 15
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: blr
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			;
	; CHECK-VSX-NEXT: blr			; P8-NOVSX-LABEL: rotl_8:
	;			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-LABEL: rotl_8:			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 15
	; CHECK-NOVSX: # %bb.0: # %entry			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI5_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI5_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI5_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI5_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 8>			%shl = shl <1 x i128> %num, <i128 8>
	%shr = lshr <1 x i128> %num, <i128 120>			%shr = lshr <1 x i128> %num, <i128 120>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_120(<1 x i128> %num) {			define <1 x i128> @rotl_120(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_120:			; P9-VSX-LABEL: rotl_120:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI6_0@toc@ha			; P9-VSX-NEXT: vsldoi v2, v2, v2, 1
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI6_0@toc@l			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			;
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI6_1@toc@ha			; P9-NOVSX-LABEL: rotl_120:
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI6_1@toc@l			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 1
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-VSX-NEXT: vsl v3, v4, v3			;
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P8-VSX-LABEL: rotl_120:
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: vsldoi v2, v2, v2, 1
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: blr
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			;
	; CHECK-VSX-NEXT: blr			; P8-NOVSX-LABEL: rotl_120:
	;			; P8-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-LABEL: rotl_120:			; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 1
	; CHECK-NOVSX: # %bb.0: # %entry			; P8-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI6_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI6_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI6_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI6_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 120>			%shl = shl <1 x i128> %num, <i128 120>
	%shr = lshr <1 x i128> %num, <i128 8>			%shr = lshr <1 x i128> %num, <i128 8>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @rotl_28(<1 x i128> %num) {			define <1 x i128> @rotl_28(<1 x i128> %num) {
	; CHECK-VSX-LABEL: rotl_28:			; P9-VSX-LABEL: rotl_28:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI7_0@toc@ha			; P9-VSX-NEXT: mfvsrld r4, v2
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI7_0@toc@l			; P9-VSX-NEXT: mfvsrd r3, v2
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			; P9-VSX-NEXT: rotldi r5, r4, 28
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI7_1@toc@ha			; P9-VSX-NEXT: rldimi r5, r3, 28, 0
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI7_1@toc@l			; P9-VSX-NEXT: rotldi r3, r3, 28
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-VSX-NEXT: rldimi r3, r4, 28, 0
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-VSX-NEXT: mtvsrdd v2, r5, r3
	; CHECK-VSX-NEXT: vsl v3, v4, v3			; P9-VSX-NEXT: blr
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			;
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P9-NOVSX-LABEL: rotl_28:
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P9-NOVSX-NEXT: addi r3, r1, -32
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			; P9-NOVSX-NEXT: stvx v2, 0, r3
	; CHECK-VSX-NEXT: blr			; P9-NOVSX-NEXT: ld r4, -32(r1)
	;			; P9-NOVSX-NEXT: ld r3, -24(r1)
	; CHECK-NOVSX-LABEL: rotl_28:			; P9-NOVSX-NEXT: rotldi r5, r4, 28
	; CHECK-NOVSX: # %bb.0: # %entry			; P9-NOVSX-NEXT: rldimi r5, r3, 28, 0
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI7_0@toc@ha			; P9-NOVSX-NEXT: rotldi r3, r3, 28
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI7_0@toc@l			; P9-NOVSX-NEXT: rldimi r3, r4, 28, 0
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3			; P9-NOVSX-NEXT: std r3, -16(r1)
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI7_1@toc@ha			; P9-NOVSX-NEXT: addi r3, r1, -16
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI7_1@toc@l			; P9-NOVSX-NEXT: std r5, -8(r1)
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: lvx v2, 0, r3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: blr
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3			;
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3			; P8-VSX-LABEL: rotl_28:
				lkailUnsubmitted Not Done Reply Inline Actions New sequence looks getting more memory ops than original one. lkail: New sequence looks getting more memory ops than original one.
				steven.zhangUnsubmitted Not Done Reply Inline Actions I believe they are using to move the VSR to two GPR. And yes, we need to take a more look to see if there is any better way to handle it. steven.zhang: I believe they are using to move the VSR to two GPR. And yes, we need to take a more look to…
				shawnlUnsubmitted Not Done Reply Inline Actions Is there any way to only lower to scalar if the value does not need to be in a vector register like it does here? Also, why does the vector code here look better than the version in my PR?: swap_with_shift: # @swap_with_shift xxspltd 35, 34, 1 xxswapd 34, 34 xxlxor 0, 0, 0 <=== the version on left does not need this xor xxpermdi 35, 35, 0, 1 xxpermdi 34, 0, 34, 1 xxlor 34, 35, 34 blr shawnl: Is there any way to only lower to scalar if the value does not need to be in a vector register…
				EsmeAuthorUnsubmitted Done Reply Inline Actions Is there any way to only lower to scalar if the value does not need to be in a vector register like it does here? I will take a look into it, thx. why does the vector code here look better than the version in my PR? Because the llc option -mcpu=pwr9 was added. Esme: > Is there any way to only lower to scalar if the value does not need to be in a vector…
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4			; P8-VSX: # %bb.0: # %entry
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15			; P8-VSX-NEXT: xxswapd vs0, v2
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4			; P8-VSX-NEXT: mfvsrd r3, v2
	; CHECK-NOVSX-NEXT: vor v2, v3, v2			; P8-VSX-NEXT: rotldi r5, r3, 28
	; CHECK-NOVSX-NEXT: blr			; P8-VSX-NEXT: mffprd r4, f0
				; P8-VSX-NEXT: rldimi r5, r4, 28, 0
				; P8-VSX-NEXT: rotldi r4, r4, 28
				; P8-VSX-NEXT: rldimi r4, r3, 28, 0
				; P8-VSX-NEXT: mtfprd f0, r5
				; P8-VSX-NEXT: mtfprd f1, r4
				; P8-VSX-NEXT: xxmrghd v2, vs1, vs0
				; P8-VSX-NEXT: blr
				;
				; P8-NOVSX-LABEL: rotl_28:
				; P8-NOVSX: # %bb.0: # %entry
				; P8-NOVSX-NEXT: addi r3, r1, -32
				; P8-NOVSX-NEXT: stvx v2, 0, r3
				; P8-NOVSX-NEXT: ld r3, -24(r1)
				; P8-NOVSX-NEXT: ld r4, -32(r1)
				; P8-NOVSX-NEXT: rotldi r5, r4, 28
				; P8-NOVSX-NEXT: rotldi r6, r3, 28
				; P8-NOVSX-NEXT: rldimi r5, r3, 28, 0
				; P8-NOVSX-NEXT: rldimi r6, r4, 28, 0
				; P8-NOVSX-NEXT: addi r3, r1, -16
				; P8-NOVSX-NEXT: std r5, -8(r1)
				; P8-NOVSX-NEXT: std r6, -16(r1)
				; P8-NOVSX-NEXT: lvx v2, 0, r3
				; P8-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 28>			%shl = shl <1 x i128> %num, <i128 28>
	%shr = lshr <1 x i128> %num, <i128 100>			%shr = lshr <1 x i128> %num, <i128 100>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @NO_rotl(<1 x i128> %num) {			define <1 x i128> @NO_rotl(<1 x i128> %num) {
	; CHECK-VSX-LABEL: NO_rotl:			; P9-VSX-LABEL: NO_rotl:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI8_0@toc@ha			; P9-VSX-NEXT: addis r3, r2, .LCPI8_0@toc@ha
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI8_0@toc@l			; P9-VSX-NEXT: addi r3, r3, .LCPI8_0@toc@l
	; CHECK-VSX-NEXT: lxvx v3, 0, r3			; P9-VSX-NEXT: lxvx v3, 0, r3
	; CHECK-VSX-NEXT: addis r3, r2, .LCPI8_1@toc@ha			; P9-VSX-NEXT: addis r3, r2, .LCPI8_1@toc@ha
	; CHECK-VSX-NEXT: addi r3, r3, .LCPI8_1@toc@l			; P9-VSX-NEXT: addi r3, r3, .LCPI8_1@toc@l
	; CHECK-VSX-NEXT: vslo v4, v2, v3			; P9-VSX-NEXT: vslo v4, v2, v3
	; CHECK-VSX-NEXT: vspltb v3, v3, 15			; P9-VSX-NEXT: vspltb v3, v3, 15
	; CHECK-VSX-NEXT: vsl v3, v4, v3			; P9-VSX-NEXT: vsl v3, v4, v3
	; CHECK-VSX-NEXT: lxvx v4, 0, r3			; P9-VSX-NEXT: lxvx v4, 0, r3
	; CHECK-VSX-NEXT: vsro v2, v2, v4			; P9-VSX-NEXT: vsro v2, v2, v4
	; CHECK-VSX-NEXT: vspltb v4, v4, 15			; P9-VSX-NEXT: vspltb v4, v4, 15
	; CHECK-VSX-NEXT: vsr v2, v2, v4			; P9-VSX-NEXT: vsr v2, v2, v4
	; CHECK-VSX-NEXT: xxlor v2, v3, v2			; P9-VSX-NEXT: xxlor v2, v3, v2
	; CHECK-VSX-NEXT: blr			; P9-VSX-NEXT: blr
	;			;
	; CHECK-NOVSX-LABEL: NO_rotl:			; P9-NOVSX-LABEL: NO_rotl:
	; CHECK-NOVSX: # %bb.0: # %entry			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI8_0@toc@ha			; P9-NOVSX-NEXT: addis r3, r2, .LCPI8_0@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI8_0@toc@l			; P9-NOVSX-NEXT: addi r3, r3, .LCPI8_0@toc@l
	; CHECK-NOVSX-NEXT: lvx v3, 0, r3			; P9-NOVSX-NEXT: lvx v3, 0, r3
	; CHECK-NOVSX-NEXT: addis r3, r2, .LCPI8_1@toc@ha			; P9-NOVSX-NEXT: addis r3, r2, .LCPI8_1@toc@ha
	; CHECK-NOVSX-NEXT: addi r3, r3, .LCPI8_1@toc@l			; P9-NOVSX-NEXT: addi r3, r3, .LCPI8_1@toc@l
	; CHECK-NOVSX-NEXT: vslo v4, v2, v3			; P9-NOVSX-NEXT: vslo v4, v2, v3
	; CHECK-NOVSX-NEXT: vspltb v3, v3, 15			; P9-NOVSX-NEXT: vspltb v3, v3, 15
	; CHECK-NOVSX-NEXT: vsl v3, v4, v3			; P9-NOVSX-NEXT: vsl v3, v4, v3
	; CHECK-NOVSX-NEXT: lvx v4, 0, r3			; P9-NOVSX-NEXT: lvx v4, 0, r3
	; CHECK-NOVSX-NEXT: vsro v2, v2, v4			; P9-NOVSX-NEXT: vsro v2, v2, v4
	; CHECK-NOVSX-NEXT: vspltb v4, v4, 15			; P9-NOVSX-NEXT: vspltb v4, v4, 15
	; CHECK-NOVSX-NEXT: vsr v2, v2, v4			; P9-NOVSX-NEXT: vsr v2, v2, v4
	; CHECK-NOVSX-NEXT: vor v2, v3, v2			; P9-NOVSX-NEXT: vor v2, v3, v2
	; CHECK-NOVSX-NEXT: blr			; P9-NOVSX-NEXT: blr
				;
				; P8-VSX-LABEL: NO_rotl:
				; P8-VSX: # %bb.0: # %entry
				; P8-VSX-NEXT: xxswapd vs0, v2
				; P8-VSX-NEXT: li r3, 0
				; P8-VSX-NEXT: mfvsrd r5, v2
				; P8-VSX-NEXT: mffprd r4, f0
				; P8-VSX-NEXT: mtfprd f0, r3
				; P8-VSX-NEXT: rotldi r3, r4, 20
				; P8-VSX-NEXT: sldi r4, r4, 20
				; P8-VSX-NEXT: rldimi r3, r5, 20, 0
				; P8-VSX-NEXT: mtfprd f1, r4
				; P8-VSX-NEXT: rldicl r4, r5, 28, 36
				; P8-VSX-NEXT: mtfprd f2, r3
				; P8-VSX-NEXT: mtfprd f3, r4
				; P8-VSX-NEXT: xxmrghd v2, vs2, vs1
				; P8-VSX-NEXT: xxmrghd v3, vs0, vs3
				; P8-VSX-NEXT: xxlor v2, v2, v3
				; P8-VSX-NEXT: blr
				;
				; P8-NOVSX-LABEL: NO_rotl:
				; P8-NOVSX: # %bb.0: # %entry
				; P8-NOVSX-NEXT: addis r3, r2, .LCPI8_0@toc@ha
				; P8-NOVSX-NEXT: addis r4, r2, .LCPI8_1@toc@ha
				; P8-NOVSX-NEXT: addi r3, r3, .LCPI8_0@toc@l
				; P8-NOVSX-NEXT: lvx v3, 0, r3
				; P8-NOVSX-NEXT: addi r3, r4, .LCPI8_1@toc@l
				; P8-NOVSX-NEXT: lvx v4, 0, r3
				; P8-NOVSX-NEXT: vslo v5, v2, v3
				; P8-NOVSX-NEXT: vspltb v3, v3, 15
				; P8-NOVSX-NEXT: vsro v2, v2, v4
				; P8-NOVSX-NEXT: vspltb v4, v4, 15
				; P8-NOVSX-NEXT: vsl v3, v5, v3
				; P8-NOVSX-NEXT: vsr v2, v2, v4
				; P8-NOVSX-NEXT: vor v2, v3, v2
				; P8-NOVSX-NEXT: blr
	entry:			entry:
	%shl = shl <1 x i128> %num, <i128 20>			%shl = shl <1 x i128> %num, <i128 20>
	%shr = lshr <1 x i128> %num, <i128 100>			%shr = lshr <1 x i128> %num, <i128 100>
	%or = or <1 x i128> %shl, %shr			%or = or <1 x i128> %shl, %shr
	ret <1 x i128> %or			ret <1 x i128> %or
	}			}

	define <1 x i128> @shufflevector(<1 x i128> %num) {			define <1 x i128> @shufflevector(<1 x i128> %num) {
	; CHECK-VSX-LABEL: shufflevector:			; P9-VSX-LABEL: shufflevector:
	; CHECK-VSX: # %bb.0: # %entry			; P9-VSX: # %bb.0: # %entry
	; CHECK-VSX-NEXT: xxswapd v2, v2			; P9-VSX-NEXT: xxswapd v2, v2
	; CHECK-VSX-NEXT: blr			; P9-VSX-NEXT: blr
	;			;
	; CHECK-NOVSX-LABEL: shufflevector:			; P9-NOVSX-LABEL: shufflevector:
	; CHECK-NOVSX: # %bb.0: # %entry			; P9-NOVSX: # %bb.0: # %entry
	; CHECK-NOVSX-NEXT: vsldoi v2, v2, v2, 8			; P9-NOVSX-NEXT: vsldoi v2, v2, v2, 8
	; CHECK-NOVSX-NEXT: blr			; P9-NOVSX-NEXT: blr
				;
				; P8-VSX-LABEL: shufflevector:
				; P8-VSX: # %bb.0: # %entry
				; P8-VSX-NEXT: xxswapd v2, v2
				; P8-VSX-NEXT: blr
				;
				; P8-NOVSX-LABEL: shufflevector:
				; P8-NOVSX: # %bb.0: # %entry
				; P8-NOVSX-NEXT: vsldoi v2, v2, v2, 8
				; P8-NOVSX-NEXT: blr
	entry:			entry:
	%0 = bitcast <1 x i128> %num to <2 x i64>			%0 = bitcast <1 x i128> %num to <2 x i64>
	%vecins2 = shufflevector <2 x i64> %0, <2 x i64> undef, <2 x i32> <i32 1, i32 0>			%vecins2 = shufflevector <2 x i64> %0, <2 x i64> undef, <2 x i32> <i32 1, i32 0>
	%1 = bitcast <2 x i64> %vecins2 to <1 x i128>			%1 = bitcast <2 x i64> %vecins2 to <1 x i128>
	ret <1 x i128> %1			ret <1 x i128> %1
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Custom lower rotl v1i128 to vector_shuffle.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 271548

llvm/lib/Target/PowerPC/PPCISelLowering.h

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/PowerPC/pr45628.ll

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Custom lower rotl v1i128 to vector_shuffle.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 271548

llvm/lib/Target/PowerPC/PPCISelLowering.h

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/PowerPC/pr45628.ll

[PowerPC] Custom lower rotl v1i128 to vector_shuffle.
ClosedPublic