Diff 529357

llvm/lib/Target/WebAssembly/WebAssemblyISelLowering.h

Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines	private:
SDValue LowerGlobalTLSAddress(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerGlobalTLSAddress(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerExternalSymbol(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerExternalSymbol(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerBR_JT(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerBR_JT(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerJumpTable(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerJumpTable(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerVASTART(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVASTART(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerCopyToReg(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerCopyToReg(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerIntrinsic(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerIntrinsic(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;
		SDValue LowerEXTEND_VECTOR_INREG(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerSETCC(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerSETCC(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerAccessVectorElement(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerAccessVectorElement(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerShift(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerShift(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerFP_TO_INT_SAT(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerFP_TO_INT_SAT(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerLoad(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerLoad(SDValue Op, SelectionDAG &DAG) const;
SDValue LowerStore(SDValue Op, SelectionDAG &DAG) const;		SDValue LowerStore(SDValue Op, SelectionDAG &DAG) const;
Show All 15 Lines

llvm/lib/Target/WebAssembly/WebAssemblyISelLowering.cpp

Show First 20 Lines • Show All 151 Lines • ▼ Show 20 Lines	WebAssemblyTargetLowering::WebAssemblyTargetLowering(

if (Subtarget->hasNontrappingFPToInt())		if (Subtarget->hasNontrappingFPToInt())
for (auto Op : {ISD::FP_TO_SINT_SAT, ISD::FP_TO_UINT_SAT})		for (auto Op : {ISD::FP_TO_SINT_SAT, ISD::FP_TO_UINT_SAT})
for (auto T : {MVT::i32, MVT::i64})		for (auto T : {MVT::i32, MVT::i64})
setOperationAction(Op, T, Custom);		setOperationAction(Op, T, Custom);

// SIMD-specific configuration		// SIMD-specific configuration
if (Subtarget->hasSIMD128()) {		if (Subtarget->hasSIMD128()) {
		// Combine vector mask reductions into alltrue/anytrue
		setTargetDAGCombine(ISD::SETCC);

		// Convert vector to integer bitcasts to bitmask
		setTargetDAGCombine(ISD::BITCAST);

// Hoist bitcasts out of shuffles		// Hoist bitcasts out of shuffles
setTargetDAGCombine(ISD::VECTOR_SHUFFLE);		setTargetDAGCombine(ISD::VECTOR_SHUFFLE);

// Combine extends of extract_subvectors into widening ops		// Combine extends of extract_subvectors into widening ops
setTargetDAGCombine({ISD::SIGN_EXTEND, ISD::ZERO_EXTEND});		setTargetDAGCombine({ISD::SIGN_EXTEND, ISD::ZERO_EXTEND});

// Combine int_to_fp or fp_extend of extract_vectors and vice versa into		// Combine int_to_fp or fp_extend of extract_vectors and vice versa into
// conversions ops		// conversions ops
▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	if (Subtarget->hasSIMD128()) {
for (auto Op :		for (auto Op :
{ISD::SINT_TO_FP, ISD::UINT_TO_FP, ISD::FP_TO_SINT, ISD::FP_TO_UINT})		{ISD::SINT_TO_FP, ISD::UINT_TO_FP, ISD::FP_TO_SINT, ISD::FP_TO_UINT})
for (auto T : {MVT::v2i64, MVT::v2f64})		for (auto T : {MVT::v2i64, MVT::v2f64})
setOperationAction(Op, T, Expand);		setOperationAction(Op, T, Expand);

// But saturating fp_to_int converstions are		// But saturating fp_to_int converstions are
for (auto Op : {ISD::FP_TO_SINT_SAT, ISD::FP_TO_UINT_SAT})		for (auto Op : {ISD::FP_TO_SINT_SAT, ISD::FP_TO_UINT_SAT})
setOperationAction(Op, MVT::v4i32, Custom);		setOperationAction(Op, MVT::v4i32, Custom);

		// Support vector extending
		for (auto T : MVT::integer_fixedlen_vector_valuetypes()) {
		setOperationAction(ISD::SIGN_EXTEND_VECTOR_INREG, T, Custom);
		setOperationAction(ISD::ZERO_EXTEND_VECTOR_INREG, T, Custom);
		}
}		}

// As a special case, these operators use the type to mean the type to		// As a special case, these operators use the type to mean the type to
// sign-extend from.		// sign-extend from.
setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Expand);		setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Expand);
if (!Subtarget->hasSignExt()) {		if (!Subtarget->hasSignExt()) {
// Sign extends are legal only when extending a vector extract		// Sign extends are legal only when extending a vector extract
auto Action = Subtarget->hasSIMD128() ? Custom : Expand;		auto Action = Subtarget->hasSIMD128() ? Custom : Expand;
▲ Show 20 Lines • Show All 1,100 Lines • ▼ Show 20 Lines	void WebAssemblyTargetLowering::ReplaceNodeResults(
SDNode *N, SmallVectorImpl<SDValue> &Results, SelectionDAG &DAG) const {		SDNode *N, SmallVectorImpl<SDValue> &Results, SelectionDAG &DAG) const {
switch (N->getOpcode()) {		switch (N->getOpcode()) {
case ISD::SIGN_EXTEND_INREG:		case ISD::SIGN_EXTEND_INREG:
// Do not add any results, signifying that N should not be custom lowered		// Do not add any results, signifying that N should not be custom lowered
// after all. This happens because simd128 turns on custom lowering for		// after all. This happens because simd128 turns on custom lowering for
// SIGN_EXTEND_INREG, but for non-vector sign extends the result might be an		// SIGN_EXTEND_INREG, but for non-vector sign extends the result might be an
// illegal type.		// illegal type.
break;		break;
		case ISD::SIGN_EXTEND_VECTOR_INREG:
		case ISD::ZERO_EXTEND_VECTOR_INREG:
		// Do not add any results, signifying that N should not be custom lowered.
		// EXTEND_VECTOR_INREG is implemented for some vectors, but not all.
		break;
default:		default:
llvm_unreachable(		llvm_unreachable(
"ReplaceNodeResults not implemented for this op for WebAssembly!");		"ReplaceNodeResults not implemented for this op for WebAssembly!");
}		}
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Custom lowering hooks.		// Custom lowering hooks.
Show All 34 Lines	SDValue WebAssemblyTargetLowering::LowerOperation(SDValue Op,
case ISD::INSERT_VECTOR_ELT:		case ISD::INSERT_VECTOR_ELT:
return LowerAccessVectorElement(Op, DAG);		return LowerAccessVectorElement(Op, DAG);
case ISD::INTRINSIC_VOID:		case ISD::INTRINSIC_VOID:
case ISD::INTRINSIC_WO_CHAIN:		case ISD::INTRINSIC_WO_CHAIN:
case ISD::INTRINSIC_W_CHAIN:		case ISD::INTRINSIC_W_CHAIN:
return LowerIntrinsic(Op, DAG);		return LowerIntrinsic(Op, DAG);
case ISD::SIGN_EXTEND_INREG:		case ISD::SIGN_EXTEND_INREG:
return LowerSIGN_EXTEND_INREG(Op, DAG);		return LowerSIGN_EXTEND_INREG(Op, DAG);
		case ISD::ZERO_EXTEND_VECTOR_INREG:
		case ISD::SIGN_EXTEND_VECTOR_INREG:
		return LowerEXTEND_VECTOR_INREG(Op, DAG);
case ISD::BUILD_VECTOR:		case ISD::BUILD_VECTOR:
return LowerBUILD_VECTOR(Op, DAG);		return LowerBUILD_VECTOR(Op, DAG);
case ISD::VECTOR_SHUFFLE:		case ISD::VECTOR_SHUFFLE:
return LowerVECTOR_SHUFFLE(Op, DAG);		return LowerVECTOR_SHUFFLE(Op, DAG);
case ISD::SETCC:		case ISD::SETCC:
return LowerSETCC(Op, DAG);		return LowerSETCC(Op, DAG);
case ISD::SHL:		case ISD::SHL:
case ISD::SRA:		case ISD::SRA:
▲ Show 20 Lines • Show All 437 Lines • ▼ Show 20 Lines	SDValue NewIndex =
DAG.getConstant(IndexVal * Scale, DL, Index->getValueType(0));		DAG.getConstant(IndexVal * Scale, DL, Index->getValueType(0));
SDValue NewExtract = DAG.getNode(		SDValue NewExtract = DAG.getNode(
ISD::EXTRACT_VECTOR_ELT, DL, Extract.getValueType(),		ISD::EXTRACT_VECTOR_ELT, DL, Extract.getValueType(),
DAG.getBitcast(ExtractedVecT, Extract.getOperand(0)), NewIndex);		DAG.getBitcast(ExtractedVecT, Extract.getOperand(0)), NewIndex);
return DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, Op.getValueType(), NewExtract,		return DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, Op.getValueType(), NewExtract,
Op.getOperand(1));		Op.getOperand(1));
}		}

		SDValue
		WebAssemblyTargetLowering::LowerEXTEND_VECTOR_INREG(SDValue Op,
		SelectionDAG &DAG) const {
		SDLoc DL(Op);
		EVT VT = Op.getValueType();
		SDValue Src = Op.getOperand(0);
		EVT SrcVT = Src.getValueType();

		if (SrcVT.getVectorElementType() == MVT::i1 \|\|
		SrcVT.getVectorElementType() == MVT::i64)
		return SDValue();

		assert(VT.getScalarSizeInBits() % SrcVT.getScalarSizeInBits() == 0 &&
		"Unexpected extension factor.");
		unsigned Scale = VT.getScalarSizeInBits() / SrcVT.getScalarSizeInBits();

		if (Scale != 2 && Scale != 4 && Scale != 8)
		return SDValue();

		unsigned Ext;
		switch (Op.getOpcode()) {
		case ISD::ZERO_EXTEND_VECTOR_INREG:
		Ext = WebAssemblyISD::EXTEND_LOW_U;
		break;
		case ISD::SIGN_EXTEND_VECTOR_INREG:
		Ext = WebAssemblyISD::EXTEND_LOW_S;
		break;
		}

		SDValue Ret = Src;
		while (Scale != 1) {
		Ret = DAG.getNode(Ext, DL,
		Ret.getValueType()
		.widenIntegerVectorElementType(*DAG.getContext())
		.getHalfNumVectorElementsVT(*DAG.getContext()),
		Ret);
		Scale /= 2;
		}
		assert(Ret.getValueType() == VT);
		return Ret;
		}

static SDValue LowerConvertLow(SDValue Op, SelectionDAG &DAG) {		static SDValue LowerConvertLow(SDValue Op, SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
if (Op.getValueType() != MVT::v2f64)		if (Op.getValueType() != MVT::v2f64)
return SDValue();		return SDValue();

auto GetConvertedLane = [](SDValue Op, unsigned &Opcode, SDValue &SrcVec,		auto GetConvertedLane = [](SDValue Op, unsigned &Opcode, SDValue &SrcVec,
unsigned &Index) -> bool {		unsigned &Index) -> bool {
switch (Op.getOpcode()) {		switch (Op.getOpcode()) {
▲ Show 20 Lines • Show All 799 Lines • ▼ Show 20 Lines	static SDValue performTruncateCombine(SDNode *N,

SDLoc DL(N);		SDLoc DL(N);
APInt Mask = APInt::getLowBitsSet(InVT.getScalarSizeInBits(),		APInt Mask = APInt::getLowBitsSet(InVT.getScalarSizeInBits(),
OutVT.getScalarSizeInBits());		OutVT.getScalarSizeInBits());
In = DAG.getNode(ISD::AND, DL, InVT, In, DAG.getConstant(Mask, DL, InVT));		In = DAG.getNode(ISD::AND, DL, InVT, In, DAG.getConstant(Mask, DL, InVT));
return truncateVectorWithNARROW(OutVT, In, DL, DAG);		return truncateVectorWithNARROW(OutVT, In, DL, DAG);
}		}

		static SDValue performBitcastCombine(SDNode *N,
		TargetLowering::DAGCombinerInfo &DCI) {
		auto &DAG = DCI.DAG;
		SDLoc DL(N);
		SDValue Src = N->getOperand(0);
		EVT VT = N->getValueType(0);
		EVT SrcVT = Src.getValueType();

		// bitcast <N x i1> to iN
		// ==> bitmask
		if (DCI.isBeforeLegalize() && VT.isScalarInteger() &&
		SrcVT.isFixedLengthVector() && SrcVT.getScalarType() == MVT::i1) {
		unsigned NumElts = SrcVT.getVectorNumElements();
		assert(NumElts == 2 \|\| NumElts == 4 \|\| NumElts == 8 \|\| NumElts == 16);
		EVT Width = MVT::getIntegerVT(128 / NumElts);
		return DAG.getZExtOrTrunc(
		DAG.getNode(ISD::INTRINSIC_WO_CHAIN, DL, MVT::i32,
		{DAG.getConstant(Intrinsic::wasm_bitmask, DL, MVT::i32),
		DAG.getSExtOrTrunc(N->getOperand(0), DL,
		SrcVT.changeVectorElementType(Width))}),
		DL, VT);
		}

		return SDValue();
		}

		static SDValue performSETCCCombine(SDNode *N,
		TargetLowering::DAGCombinerInfo &DCI) {
		auto &DAG = DCI.DAG;

		SDValue LHS = N->getOperand(0);
		SDValue RHS = N->getOperand(1);
		ISD::CondCode Cond = cast<CondCodeSDNode>(N->getOperand(2))->get();
		SDLoc DL(N);
		EVT VT = N->getValueType(0);

		// setcc (iN (bitcast (vNi1 X))), 0, ne
		// ==> any_true (vNi1 X)
		// setcc (iN (bitcast (vNi1 X))), 0, eq
		// ==> xor (any_true (vNi1 X)), -1
		// setcc (iN (bitcast (vNi1 X))), -1, eq
		// ==> all_true (vNi1 X)
		// setcc (iN (bitcast (vNi1 X))), -1, ne
		// ==> xor (all_true (vNi1 X)), -1
		if (DCI.isBeforeLegalize() && VT.isScalarInteger() &&
		(Cond == ISD::SETEQ \|\| Cond == ISD::SETNE) &&
		(isNullConstant(RHS) \|\| isAllOnesConstant(RHS)) &&
		LHS->getOpcode() == ISD::BITCAST) {
		EVT FromVT = LHS->getOperand(0).getValueType();
		if (FromVT.isFixedLengthVector() &&
		FromVT.getVectorElementType() == MVT::i1) {
		int Intrin = isNullConstant(RHS) ? Intrinsic::wasm_anytrue
		: Intrinsic::wasm_alltrue;
		unsigned NumElts = FromVT.getVectorNumElements();
		assert(NumElts == 2 \|\| NumElts == 4 \|\| NumElts == 8 \|\| NumElts == 16);
		EVT Width = MVT::getIntegerVT(128 / NumElts);
		SDValue Ret = DAG.getZExtOrTrunc(
		DAG.getNode(
		ISD::INTRINSIC_WO_CHAIN, DL, MVT::i32,
		{DAG.getConstant(Intrin, DL, MVT::i32),
		DAG.getSExtOrTrunc(LHS->getOperand(0), DL,
		FromVT.changeVectorElementType(Width))}),
		DL, MVT::i1);
		if ((isNullConstant(RHS) && (Cond == ISD::SETEQ)) \|\|
		(isAllOnesConstant(RHS) && (Cond == ISD::SETNE))) {
		Ret = DAG.getNOT(DL, Ret, MVT::i1);
		}
		return DAG.getZExtOrTrunc(Ret, DL, VT);
		}
		}

		return SDValue();
		}

SDValue		SDValue
WebAssemblyTargetLowering::PerformDAGCombine(SDNode *N,		WebAssemblyTargetLowering::PerformDAGCombine(SDNode *N,
DAGCombinerInfo &DCI) const {		DAGCombinerInfo &DCI) const {
switch (N->getOpcode()) {		switch (N->getOpcode()) {
default:		default:
return SDValue();		return SDValue();
		case ISD::BITCAST:
		return performBitcastCombine(N, DCI);
		case ISD::SETCC:
		return performSETCCCombine(N, DCI);
case ISD::VECTOR_SHUFFLE:		case ISD::VECTOR_SHUFFLE:
return performVECTOR_SHUFFLECombine(N, DCI);		return performVECTOR_SHUFFLECombine(N, DCI);
case ISD::SIGN_EXTEND:		case ISD::SIGN_EXTEND:
case ISD::ZERO_EXTEND:		case ISD::ZERO_EXTEND:
return performVectorExtendCombine(N, DCI);		return performVectorExtendCombine(N, DCI);
case ISD::UINT_TO_FP:		case ISD::UINT_TO_FP:
case ISD::SINT_TO_FP:		case ISD::SINT_TO_FP:
return performVectorExtendToFPCombine(N, DCI);		return performVectorExtendToFPCombine(N, DCI);
Show All 9 Lines

llvm/test/CodeGen/WebAssembly/simd-extending-convert.ll

Show All 30 Lines	; CHECK-NEXT: # fallthrough-return
%extended = uitofp <4 x i16> %high to <4 x float>		%extended = uitofp <4 x i16> %high to <4 x float>
ret <4 x float> %extended		ret <4 x float> %extended
}		}

define <4 x float> @extend_to_float_low_i8x16_u(<8 x i8> %x) {		define <4 x float> @extend_to_float_low_i8x16_u(<8 x i8> %x) {
; CHECK-LABEL: extend_to_float_low_i8x16_u:		; CHECK-LABEL: extend_to_float_low_i8x16_u:
; CHECK: .functype extend_to_float_low_i8x16_u (v128) -> (v128)		; CHECK: .functype extend_to_float_low_i8x16_u (v128) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: f32x4.convert_i32x4_u		; CHECK-NEXT: f32x4.convert_i32x4_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%low = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%low = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%extended = uitofp <4 x i8> %low to <4 x float>		%extended = uitofp <4 x i8> %low to <4 x float>
ret <4 x float> %extended		ret <4 x float> %extended
}		}

define <4 x float> @extend_to_float_high_i8x16_u(<8 x i8> %x) {		define <4 x float> @extend_to_float_high_i8x16_u(<8 x i8> %x) {
; CHECK-LABEL: extend_to_float_high_i8x16_u:		; CHECK-LABEL: extend_to_float_high_i8x16_u:
; CHECK: .functype extend_to_float_high_i8x16_u (v128) -> (v128)		; CHECK: .functype extend_to_float_high_i8x16_u (v128) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i8x16.shuffle 4, 17, 18, 19, 5, 21, 22, 23, 6, 25, 26, 27, 7, 29, 30, 31		; CHECK-NEXT: i8x16.shuffle 4, 5, 6, 7, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: f32x4.convert_i32x4_u		; CHECK-NEXT: f32x4.convert_i32x4_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%high = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 4, i32 5, i32 6, i32 7>		%high = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 4, i32 5, i32 6, i32 7>
%extended = uitofp <4 x i8> %high to <4 x float>		%extended = uitofp <4 x i8> %high to <4 x float>
ret <4 x float> %extended		ret <4 x float> %extended
}		}

define <4 x float> @extend_to_float_low_i16x8_s(<8 x i16> %x) {		define <4 x float> @extend_to_float_low_i16x8_s(<8 x i16> %x) {
Show All 22 Lines	; CHECK-NEXT: # fallthrough-return
ret <4 x float> %extended		ret <4 x float> %extended
}		}

define <4 x float> @extend_to_float_low_i8x16_s(<8 x i8> %x) {		define <4 x float> @extend_to_float_low_i8x16_s(<8 x i8> %x) {
; CHECK-LABEL: extend_to_float_low_i8x16_s:		; CHECK-LABEL: extend_to_float_low_i8x16_s:
; CHECK: .functype extend_to_float_low_i8x16_s (v128) -> (v128)		; CHECK: .functype extend_to_float_low_i8x16_s (v128) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: f32x4.convert_i32x4_s		; CHECK-NEXT: f32x4.convert_i32x4_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%low = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>		%low = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
%extended = sitofp <4 x i8> %low to <4 x float>		%extended = sitofp <4 x i8> %low to <4 x float>
ret <4 x float> %extended		ret <4 x float> %extended
}		}

define <4 x float> @extend_to_float_high_i8x16_s(<8 x i8> %x) {		define <4 x float> @extend_to_float_high_i8x16_s(<8 x i8> %x) {
; CHECK-LABEL: extend_to_float_high_i8x16_s:		; CHECK-LABEL: extend_to_float_high_i8x16_s:
; CHECK: .functype extend_to_float_high_i8x16_s (v128) -> (v128)		; CHECK: .functype extend_to_float_high_i8x16_s (v128) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i8x16.shuffle 4, 0, 0, 0, 5, 0, 0, 0, 6, 0, 0, 0, 7, 0, 0, 0		; CHECK-NEXT: i8x16.shuffle 4, 5, 6, 7, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: i32.const 24		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i32x4.shl		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: f32x4.convert_i32x4_s		; CHECK-NEXT: f32x4.convert_i32x4_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%high = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 4, i32 5, i32 6, i32 7>		%high = shufflevector <8 x i8> %x, <8 x i8> undef, <4 x i32> <i32 4, i32 5, i32 6, i32 7>
%extended = sitofp <4 x i8> %high to <4 x float>		%extended = sitofp <4 x i8> %high to <4 x float>
ret <4 x float> %extended		ret <4 x float> %extended
}		}

define <2 x double> @extend_to_double_low_i32x4_u(<4 x i32> %x) {		define <2 x double> @extend_to_double_low_i32x4_u(<4 x i32> %x) {
; CHECK-LABEL: extend_to_double_low_i32x4_u:		; CHECK-LABEL: extend_to_double_low_i32x4_u:
; CHECK: .functype extend_to_double_low_i32x4_u (v128) -> (v128)		; CHECK: .functype extend_to_double_low_i32x4_u (v128) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: f64x2.convert_low_i32x4_u		; CHECK-NEXT: f64x2.convert_low_i32x4_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%low = shufflevector <4 x i32> %x, <4 x i32> undef, <2 x i32> <i32 0, i32 1>		%low = shufflevector <4 x i32> %x, <4 x i32> undef, <2 x i32> <i32 0, i32 1>
%extended = uitofp <2 x i32> %low to <2 x double>		%extended = uitofp <2 x i32> %low to <2 x double>
ret <2 x double> %extended		ret <2 x double> %extended
}		}

define <2 x double> @extend_to_double_low_i16x4_u(<4 x i16> %x) {		define <2 x double> @extend_to_double_low_i16x4_u(<4 x i16> %x) {
; CHECK-LABEL: extend_to_double_low_i16x4_u:		; CHECK-LABEL: extend_to_double_low_i16x4_u:
; CHECK: .functype extend_to_double_low_i16x4_u (v128) -> (v128)		; CHECK: .functype extend_to_double_low_i16x4_u (v128) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i8x16.shuffle 16, 17, 2, 3, 18, 19, 6, 7, 20, 21, 10, 11, 22, 23, 14, 15		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: f64x2.convert_low_i32x4_u		; CHECK-NEXT: f64x2.convert_low_i32x4_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%low = shufflevector <4 x i16> %x, <4 x i16> undef, <2 x i32> <i32 0, i32 1>		%low = shufflevector <4 x i16> %x, <4 x i16> undef, <2 x i32> <i32 0, i32 1>
%extended = uitofp <2 x i16> %low to <2 x double>		%extended = uitofp <2 x i16> %low to <2 x double>
ret <2 x double> %extended		ret <2 x double> %extended
}		}

llvm/test/CodeGen/WebAssembly/simd-extending.ll

	Show First 20 Lines • Show All 164 Lines • ▼ Show 20 Lines
	;; the low or high half are correctly expanded.			;; the low or high half are correctly expanded.

	define <8 x i16> @extend_lowish_i8x16_s(<16 x i8> %v) {			define <8 x i16> @extend_lowish_i8x16_s(<16 x i8> %v) {
	; CHECK-LABEL: extend_lowish_i8x16_s:			; CHECK-LABEL: extend_lowish_i8x16_s:
	; CHECK: .functype extend_lowish_i8x16_s (v128) -> (v128)			; CHECK: .functype extend_lowish_i8x16_s (v128) -> (v128)
	; CHECK-NEXT: # %bb.0:			; CHECK-NEXT: # %bb.0:
	; CHECK-NEXT: local.get 0			; CHECK-NEXT: local.get 0
	; CHECK-NEXT: local.get 0			; CHECK-NEXT: local.get 0
	; CHECK-NEXT: i8x16.shuffle 1, 0, 2, 0, 3, 0, 4, 0, 5, 0, 6, 0, 7, 0, 8, 0			; CHECK-NEXT: i8x16.shuffle 1, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0, 0, 0, 0, 0, 0
	; CHECK-NEXT: i32.const 8			; CHECK-NEXT: i16x8.extend_low_i8x16_s
	; CHECK-NEXT: i16x8.shl
	; CHECK-NEXT: i32.const 8
	; CHECK-NEXT: i16x8.shr_s
	; CHECK-NEXT: # fallthrough-return			; CHECK-NEXT: # fallthrough-return
	%lowish = shufflevector <16 x i8> %v, <16 x i8> undef,			%lowish = shufflevector <16 x i8> %v, <16 x i8> undef,
	<8 x i32> <i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8>			<8 x i32> <i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8>
	%extended = sext <8 x i8> %lowish to <8 x i16>			%extended = sext <8 x i8> %lowish to <8 x i16>
	ret <8 x i16> %extended			ret <8 x i16> %extended
	}			}

	define <4 x i32> @extend_lowish_i16x8_s(<8 x i16> %v) {			define <4 x i32> @extend_lowish_i16x8_s(<8 x i16> %v) {
	; CHECK-LABEL: extend_lowish_i16x8_s:			; CHECK-LABEL: extend_lowish_i16x8_s:
	; CHECK: .functype extend_lowish_i16x8_s (v128) -> (v128)			; CHECK: .functype extend_lowish_i16x8_s (v128) -> (v128)
	; CHECK-NEXT: # %bb.0:			; CHECK-NEXT: # %bb.0:
	; CHECK-NEXT: local.get 0			; CHECK-NEXT: local.get 0
	; CHECK-NEXT: local.get 0			; CHECK-NEXT: local.get 0
	; CHECK-NEXT: i8x16.shuffle 2, 3, 0, 1, 4, 5, 0, 1, 6, 7, 0, 1, 8, 9, 0, 1			; CHECK-NEXT: i8x16.shuffle 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 0, 1, 0, 1, 0, 1
	; CHECK-NEXT: i32.const 16			; CHECK-NEXT: i32x4.extend_low_i16x8_s
	; CHECK-NEXT: i32x4.shl
	; CHECK-NEXT: i32.const 16
	; CHECK-NEXT: i32x4.shr_s
	; CHECK-NEXT: # fallthrough-return			; CHECK-NEXT: # fallthrough-return
	%lowish = shufflevector <8 x i16> %v, <8 x i16> undef,			%lowish = shufflevector <8 x i16> %v, <8 x i16> undef,
	<4 x i32> <i32 1, i32 2, i32 3, i32 4>			<4 x i32> <i32 1, i32 2, i32 3, i32 4>
	%extended = sext <4 x i16> %lowish to <4 x i32>			%extended = sext <4 x i16> %lowish to <4 x i32>
	ret <4 x i32> %extended			ret <4 x i32> %extended
	}			}

				;; Also test vectors that aren't full 128 bits, or might require
				;; multiple extensions

				define <16 x i8> @extend_i1x16_i8(<16 x i1> %v) {
				; CHECK-LABEL: extend_i1x16_i8:
				; CHECK: .functype extend_i1x16_i8 (v128) -> (v128)
				; CHECK-NEXT: # %bb.0:
				; CHECK-NEXT: local.get 0
				; CHECK-NEXT: i32.const 7
				; CHECK-NEXT: i8x16.shl
				; CHECK-NEXT: i32.const 7
				; CHECK-NEXT: i8x16.shr_s
				; CHECK-NEXT: # fallthrough-return
				%extended = sext <16 x i1> %v to <16 x i8>
				ret <16 x i8> %extended
				}

				define <8 x i8> @extend_i1x8_i8(<8 x i1> %v) {
				; CHECK-LABEL: extend_i1x8_i8:
				; CHECK: .functype extend_i1x8_i8 (v128) -> (v128)
				; CHECK-NEXT: # %bb.0:
				; CHECK-NEXT: local.get 0
				; CHECK-NEXT: local.get 0
				; CHECK-NEXT: i8x16.shuffle 0, 2, 4, 6, 8, 10, 12, 14, 0, 0, 0, 0, 0, 0, 0, 0
				; CHECK-NEXT: i32.const 7
				; CHECK-NEXT: i8x16.shl
				; CHECK-NEXT: i32.const 7
				; CHECK-NEXT: i8x16.shr_s
				; CHECK-NEXT: # fallthrough-return
				%extended = sext <8 x i1> %v to <8 x i8>
				ret <8 x i8> %extended
				}

				define <8 x i16> @extend_i1x8_i16(<8 x i1> %v) {
				; CHECK-LABEL: extend_i1x8_i16:
				; CHECK: .functype extend_i1x8_i16 (v128) -> (v128)
				; CHECK-NEXT: # %bb.0:
				; CHECK-NEXT: local.get 0
				; CHECK-NEXT: v128.const 1, 1, 1, 1, 1, 1, 1, 1
				; CHECK-NEXT: v128.and
				; CHECK-NEXT: # fallthrough-return
				%extended = zext <8 x i1> %v to <8 x i16>
				ret <8 x i16> %extended
				}

				define <4 x i32> @extend_i8x4_i32(<4 x i8> %v) {
				; CHECK-LABEL: extend_i8x4_i32:
				; CHECK: .functype extend_i8x4_i32 (v128) -> (v128)
				; CHECK-NEXT: # %bb.0:
				; CHECK-NEXT: local.get 0
				; CHECK-NEXT: i16x8.extend_low_i8x16_u
				; CHECK-NEXT: i32x4.extend_low_i16x8_u
				; CHECK-NEXT: # fallthrough-return
				%extended = zext <4 x i8> %v to <4 x i32>
				ret <4 x i32> %extended
				}

				define <2 x i64> @extend_i8x2_i64(<2 x i8> %v) {
				; CHECK-LABEL: extend_i8x2_i64:
				; CHECK: .functype extend_i8x2_i64 (v128) -> (v128)
				; CHECK-NEXT: # %bb.0:
				; CHECK-NEXT: local.get 0
				; CHECK-NEXT: i16x8.extend_low_i8x16_s
				; CHECK-NEXT: i32x4.extend_low_i16x8_s
				; CHECK-NEXT: i64x2.extend_low_i32x4_s
				; CHECK-NEXT: # fallthrough-return
				%extended = sext <2 x i8> %v to <2 x i64>
				ret <2 x i64> %extended
				}

llvm/test/CodeGen/WebAssembly/simd-offset.ll

Show First 20 Lines • Show All 1,177 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %p		%v = load <4 x i16>, ptr %p
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32(ptr %p) {		define <4 x i32> @load_sext_v4i8_to_v4i32(ptr %p) {
; CHECK-LABEL: load_sext_v4i8_to_v4i32:		; CHECK-LABEL: load_sext_v4i8_to_v4i32:
; CHECK: .functype load_sext_v4i8_to_v4i32 (i32) -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32 (i32) -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: local.get 1		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%v = load <4 x i8>, ptr %p		%v = load <4 x i8>, ptr %p
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32(ptr %p) {		define <4 x i32> @load_zext_v4i8_to_v4i32(ptr %p) {
; CHECK-LABEL: load_zext_v4i8_to_v4i32:		; CHECK-LABEL: load_zext_v4i8_to_v4i32:
; CHECK: .functype load_zext_v4i8_to_v4i32 (i32) -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32 (i32) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%v = load <4 x i8>, ptr %p		%v = load <4 x i8>, ptr %p
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i16> @load_ext_v4i32(ptr %p) {		define <4 x i16> @load_ext_v4i32(ptr %p) {
; CHECK-LABEL: load_ext_v4i32:		; CHECK-LABEL: load_ext_v4i32:
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %s		%v = load <4 x i16>, ptr %s
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32_with_folded_offset(ptr %p) {		define <4 x i32> @load_sext_v4i8_to_v4i32_with_folded_offset(ptr %p) {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_folded_offset:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_folded_offset:
; CHECK: .functype load_sext_v4i8_to_v4i32_with_folded_offset (i32) -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_with_folded_offset (i32) -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.load32_zero 16		; CHECK-NEXT: v128.load32_zero 16
; CHECK-NEXT: local.get 1		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%q = ptrtoint ptr %p to i32		%q = ptrtoint ptr %p to i32
%r = add nuw i32 %q, 16		%r = add nuw i32 %q, 16
%s = inttoptr i32 %r to ptr		%s = inttoptr i32 %r to ptr
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_with_folded_offset(ptr %p) {		define <4 x i32> @load_zext_v4i8_to_v4i32_with_folded_offset(ptr %p) {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_folded_offset:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_folded_offset:
; CHECK: .functype load_zext_v4i8_to_v4i32_with_folded_offset (i32) -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_with_folded_offset (i32) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.load32_zero 16		; CHECK-NEXT: v128.load32_zero 16
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%q = ptrtoint ptr %p to i32		%q = ptrtoint ptr %p to i32
%r = add nuw i32 %q, 16		%r = add nuw i32 %q, 16
%s = inttoptr i32 %r to ptr		%s = inttoptr i32 %r to ptr
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %s		%v = load <4 x i16>, ptr %s
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32_with_folded_gep_offset(ptr %p) {		define <4 x i32> @load_sext_v4i8_to_v4i32_with_folded_gep_offset(ptr %p) {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_folded_gep_offset:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_folded_gep_offset:
; CHECK: .functype load_sext_v4i8_to_v4i32_with_folded_gep_offset (i32) -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_with_folded_gep_offset (i32) -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.load32_zero 4		; CHECK-NEXT: v128.load32_zero 4
; CHECK-NEXT: local.get 1		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = getelementptr inbounds <4 x i8>, ptr %p, i32 1		%s = getelementptr inbounds <4 x i8>, ptr %p, i32 1
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_with_folded_gep_offset(ptr %p) {		define <4 x i32> @load_zext_v4i8_to_v4i32_with_folded_gep_offset(ptr %p) {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_folded_gep_offset:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_folded_gep_offset:
; CHECK: .functype load_zext_v4i8_to_v4i32_with_folded_gep_offset (i32) -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_with_folded_gep_offset (i32) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: v128.load32_zero 4		; CHECK-NEXT: v128.load32_zero 4
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = getelementptr inbounds <4 x i8>, ptr %p, i32 1		%s = getelementptr inbounds <4 x i8>, ptr %p, i32 1
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i16> @load_ext_v4i32_with_folded_gep_offset(ptr %p) {		define <4 x i16> @load_ext_v4i32_with_folded_gep_offset(ptr %p) {
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %s		%v = load <4 x i16>, ptr %s
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32_with_unfolded_gep_negative_offset(ptr %p) {		define <4 x i32> @load_sext_v4i8_to_v4i32_with_unfolded_gep_negative_offset(ptr %p) {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_unfolded_gep_negative_offset:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_unfolded_gep_negative_offset:
; CHECK: .functype load_sext_v4i8_to_v4i32_with_unfolded_gep_negative_offset (i32) -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_with_unfolded_gep_negative_offset (i32) -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i32.const -4		; CHECK-NEXT: i32.const -4
; CHECK-NEXT: i32.add		; CHECK-NEXT: i32.add
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: local.get 1		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = getelementptr inbounds <4 x i8>, ptr %p, i32 -1		%s = getelementptr inbounds <4 x i8>, ptr %p, i32 -1
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_with_unfolded_gep_negative_offset(ptr %p) {		define <4 x i32> @load_zext_v4i8_to_v4i32_with_unfolded_gep_negative_offset(ptr %p) {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_unfolded_gep_negative_offset:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_unfolded_gep_negative_offset:
; CHECK: .functype load_zext_v4i8_to_v4i32_with_unfolded_gep_negative_offset (i32) -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_with_unfolded_gep_negative_offset (i32) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i32.const -4		; CHECK-NEXT: i32.const -4
; CHECK-NEXT: i32.add		; CHECK-NEXT: i32.add
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = getelementptr inbounds <4 x i8>, ptr %p, i32 -1		%s = getelementptr inbounds <4 x i8>, ptr %p, i32 -1
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i16> @load_ext_v4i32_with_unfolded_gep_negative_offset(ptr %p) {		define <4 x i16> @load_ext_v4i32_with_unfolded_gep_negative_offset(ptr %p) {
▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %s		%v = load <4 x i16>, ptr %s
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32_with_unfolded_offset(ptr %p) {		define <4 x i32> @load_sext_v4i8_to_v4i32_with_unfolded_offset(ptr %p) {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_unfolded_offset:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_unfolded_offset:
; CHECK: .functype load_sext_v4i8_to_v4i32_with_unfolded_offset (i32) -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_with_unfolded_offset (i32) -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i32.const 16		; CHECK-NEXT: i32.const 16
; CHECK-NEXT: i32.add		; CHECK-NEXT: i32.add
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: local.get 1		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%q = ptrtoint ptr %p to i32		%q = ptrtoint ptr %p to i32
%r = add nsw i32 %q, 16		%r = add nsw i32 %q, 16
%s = inttoptr i32 %r to ptr		%s = inttoptr i32 %r to ptr
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_with_unfolded_offset(ptr %p) {		define <4 x i32> @load_zext_v4i8_to_v4i32_with_unfolded_offset(ptr %p) {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_unfolded_offset:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_unfolded_offset:
; CHECK: .functype load_zext_v4i8_to_v4i32_with_unfolded_offset (i32) -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_with_unfolded_offset (i32) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i32.const 16		; CHECK-NEXT: i32.const 16
; CHECK-NEXT: i32.add		; CHECK-NEXT: i32.add
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%q = ptrtoint ptr %p to i32		%q = ptrtoint ptr %p to i32
%r = add nsw i32 %q, 16		%r = add nsw i32 %q, 16
%s = inttoptr i32 %r to ptr		%s = inttoptr i32 %r to ptr
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}
▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %s		%v = load <4 x i16>, ptr %s
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32_with_unfolded_gep_offset(ptr %p) {		define <4 x i32> @load_sext_v4i8_to_v4i32_with_unfolded_gep_offset(ptr %p) {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_unfolded_gep_offset:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_with_unfolded_gep_offset:
; CHECK: .functype load_sext_v4i8_to_v4i32_with_unfolded_gep_offset (i32) -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_with_unfolded_gep_offset (i32) -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i32.const 4		; CHECK-NEXT: i32.const 4
; CHECK-NEXT: i32.add		; CHECK-NEXT: i32.add
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: local.get 1		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = getelementptr <4 x i8>, ptr %p, i32 1		%s = getelementptr <4 x i8>, ptr %p, i32 1
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_with_unfolded_gep_offset(ptr %p) {		define <4 x i32> @load_zext_v4i8_to_v4i32_with_unfolded_gep_offset(ptr %p) {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_unfolded_gep_offset:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_with_unfolded_gep_offset:
; CHECK: .functype load_zext_v4i8_to_v4i32_with_unfolded_gep_offset (i32) -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_with_unfolded_gep_offset (i32) -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: local.get 0		; CHECK-NEXT: local.get 0
; CHECK-NEXT: i32.const 4		; CHECK-NEXT: i32.const 4
; CHECK-NEXT: i32.add		; CHECK-NEXT: i32.add
; CHECK-NEXT: v128.load32_zero 0		; CHECK-NEXT: v128.load32_zero 0
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = getelementptr <4 x i8>, ptr %p, i32 1		%s = getelementptr <4 x i8>, ptr %p, i32 1
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i16> @load_ext_v4i32_with_unfolded_gep_offset(ptr %p) {		define <4 x i16> @load_ext_v4i32_with_unfolded_gep_offset(ptr %p) {
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v = load <4 x i16>, ptr %s		%v = load <4 x i16>, ptr %s
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_sext_v4i8_to_v4i32_from_numeric_address() {		define <4 x i32> @load_sext_v4i8_to_v4i32_from_numeric_address() {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_from_numeric_address:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_from_numeric_address:
; CHECK: .functype load_sext_v4i8_to_v4i32_from_numeric_address () -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_from_numeric_address () -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: i32.const 0		; CHECK-NEXT: i32.const 0
; CHECK-NEXT: v128.load32_zero 32		; CHECK-NEXT: v128.load32_zero 32
; CHECK-NEXT: local.get 0		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = inttoptr i32 32 to ptr		%s = inttoptr i32 32 to ptr
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_from_numeric_address() {		define <4 x i32> @load_zext_v4i8_to_v4i32_from_numeric_address() {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_from_numeric_address:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_from_numeric_address:
; CHECK: .functype load_zext_v4i8_to_v4i32_from_numeric_address () -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_from_numeric_address () -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: i32.const 0		; CHECK-NEXT: i32.const 0
; CHECK-NEXT: v128.load32_zero 32		; CHECK-NEXT: v128.load32_zero 32
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%s = inttoptr i32 32 to ptr		%s = inttoptr i32 32 to ptr
%v = load <4 x i8>, ptr %s		%v = load <4 x i8>, ptr %s
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i16> @load_ext_v4i32_from_numeric_address() {		define <4 x i16> @load_ext_v4i32_from_numeric_address() {
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines	; CHECK-NEXT: # fallthrough-return
%v2 = zext <4 x i16> %v to <4 x i32>		%v2 = zext <4 x i16> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

@gv_v4i8 = global <4 x i8> <i8 42, i8 42, i8 42, i8 42>		@gv_v4i8 = global <4 x i8> <i8 42, i8 42, i8 42, i8 42>
define <4 x i32> @load_sext_v4i8_to_v4i32_from_global_address() {		define <4 x i32> @load_sext_v4i8_to_v4i32_from_global_address() {
; CHECK-LABEL: load_sext_v4i8_to_v4i32_from_global_address:		; CHECK-LABEL: load_sext_v4i8_to_v4i32_from_global_address:
; CHECK: .functype load_sext_v4i8_to_v4i32_from_global_address () -> (v128)		; CHECK: .functype load_sext_v4i8_to_v4i32_from_global_address () -> (v128)
; CHECK-NEXT: .local v128
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: i32.const 0		; CHECK-NEXT: i32.const 0
; CHECK-NEXT: v128.load32_zero gv_v4i8		; CHECK-NEXT: v128.load32_zero gv_v4i8
; CHECK-NEXT: local.get 0		; CHECK-NEXT: i16x8.extend_low_i8x16_s
; CHECK-NEXT: i8x16.shuffle 0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0		; CHECK-NEXT: i32x4.extend_low_i16x8_s
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shl
; CHECK-NEXT: i32.const 24
; CHECK-NEXT: i32x4.shr_s
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%v = load <4 x i8>, ptr @gv_v4i8		%v = load <4 x i8>, ptr @gv_v4i8
%v2 = sext <4 x i8> %v to <4 x i32>		%v2 = sext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i32> @load_zext_v4i8_to_v4i32_from_global_address() {		define <4 x i32> @load_zext_v4i8_to_v4i32_from_global_address() {
; CHECK-LABEL: load_zext_v4i8_to_v4i32_from_global_address:		; CHECK-LABEL: load_zext_v4i8_to_v4i32_from_global_address:
; CHECK: .functype load_zext_v4i8_to_v4i32_from_global_address () -> (v128)		; CHECK: .functype load_zext_v4i8_to_v4i32_from_global_address () -> (v128)
; CHECK-NEXT: # %bb.0:		; CHECK-NEXT: # %bb.0:
; CHECK-NEXT: v128.const 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
; CHECK-NEXT: i32.const 0		; CHECK-NEXT: i32.const 0
; CHECK-NEXT: v128.load32_zero gv_v4i8		; CHECK-NEXT: v128.load32_zero gv_v4i8
; CHECK-NEXT: i8x16.shuffle 16, 1, 2, 3, 17, 5, 6, 7, 18, 9, 10, 11, 19, 13, 14, 15		; CHECK-NEXT: i16x8.extend_low_i8x16_u
		; CHECK-NEXT: i32x4.extend_low_i16x8_u
; CHECK-NEXT: # fallthrough-return		; CHECK-NEXT: # fallthrough-return
%v = load <4 x i8>, ptr @gv_v4i8		%v = load <4 x i8>, ptr @gv_v4i8
%v2 = zext <4 x i8> %v to <4 x i32>		%v2 = zext <4 x i8> %v to <4 x i32>
ret <4 x i32> %v2		ret <4 x i32> %v2
}		}

define <4 x i16> @load_ext_v4i32_from_global_address() {		define <4 x i16> @load_ext_v4i32_from_global_address() {
; CHECK-LABEL: load_ext_v4i32_from_global_address:		; CHECK-LABEL: load_ext_v4i32_from_global_address:
▲ Show 20 Lines • Show All 1,709 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

Improve WebAssembly vector bitmask, mask reduction, and extending
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 529357

llvm/lib/Target/WebAssembly/WebAssemblyISelLowering.h

llvm/lib/Target/WebAssembly/WebAssemblyISelLowering.cpp

llvm/test/CodeGen/WebAssembly/simd-extending-convert.ll

llvm/test/CodeGen/WebAssembly/simd-extending.ll

llvm/test/CodeGen/WebAssembly/simd-offset.ll

This is an archive of the discontinued LLVM Phabricator instance.

Improve WebAssembly vector bitmask, mask reduction, and extendingClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 529357

llvm/lib/Target/WebAssembly/WebAssemblyISelLowering.h

llvm/lib/Target/WebAssembly/WebAssemblyISelLowering.cpp

llvm/test/CodeGen/WebAssembly/simd-extending-convert.ll

llvm/test/CodeGen/WebAssembly/simd-extending.ll

llvm/test/CodeGen/WebAssembly/simd-offset.ll

Improve WebAssembly vector bitmask, mask reduction, and extending
ClosedPublic