Diff 270987

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 21,346 Lines • ▼ Show 20 Lines
}		}

// Helper function for comparing all bits of a vector against zero.		// Helper function for comparing all bits of a vector against zero.
static SDValue LowerVectorAllZero(const SDLoc &DL, SDValue V, ISD::CondCode CC,		static SDValue LowerVectorAllZero(const SDLoc &DL, SDValue V, ISD::CondCode CC,
const X86Subtarget &Subtarget,		const X86Subtarget &Subtarget,
SelectionDAG &DAG, X86::CondCode &X86CC) {		SelectionDAG &DAG, X86::CondCode &X86CC) {
EVT VT = V.getValueType();		EVT VT = V.getValueType();

// Quit if less than 128-bits or not splittable to 128/256-bit vector.		assert((CC == ISD::SETEQ \|\| CC == ISD::SETNE) && "Unsupported ISD::CondCode");
if (VT.getSizeInBits() < 128 \|\| !isPowerOf2_32(VT.getSizeInBits()))		X86CC = (CC == ISD::SETEQ ? X86::COND_E : X86::COND_NE);

		// For sub-128-bit vector, cast to (legal) integer and compare with zero.
		if (VT.getSizeInBits() < 128) {
		EVT IntVT = EVT::getIntegerVT(*DAG.getContext(), VT.getSizeInBits());
		if (!DAG.getTargetLoweringInfo().isTypeLegal(IntVT))
return SDValue();		return SDValue();
		return DAG.getNode(X86ISD::CMP, DL, MVT::i32, DAG.getBitcast(IntVT, V),
		DAG.getConstant(0, DL, IntVT));
		}

X86CC = (CC == ISD::SETEQ ? X86::COND_E : X86::COND_NE);		// Quit if not splittable to 128/256-bit vector.
		if (!isPowerOf2_32(VT.getSizeInBits()))
		return SDValue();

// Split down to 128/256-bit vector.		// Split down to 128/256-bit vector.
unsigned TestSize = Subtarget.hasAVX() ? 256 : 128;		unsigned TestSize = Subtarget.hasAVX() ? 256 : 128;
while (VT.getSizeInBits() > TestSize) {		while (VT.getSizeInBits() > TestSize) {
auto Split = DAG.SplitVector(V, DL);		auto Split = DAG.SplitVector(V, DL);
VT = Split.first.getValueType();		VT = Split.first.getValueType();
V = DAG.getNode(ISD::OR, DL, VT, Split.first, Split.second);		V = DAG.getNode(ISD::OR, DL, VT, Split.first, Split.second);
}		}

bool UsePTEST = Subtarget.hasSSE41();		bool UsePTEST = Subtarget.hasSSE41();
if (UsePTEST) {		if (UsePTEST) {
MVT TestVT = VT.is128BitVector() ? MVT::v2i64 : MVT::v4i64;		MVT TestVT = VT.is128BitVector() ? MVT::v2i64 : MVT::v4i64;
V = DAG.getBitcast(TestVT, V);		V = DAG.getBitcast(TestVT, V);
return DAG.getNode(X86ISD::PTEST, DL, MVT::i32, V, V);		return DAG.getNode(X86ISD::PTEST, DL, MVT::i32, V, V);
}		}

V = DAG.getBitcast(MVT::v16i8, V);		V = DAG.getBitcast(MVT::v16i8, V);
V = DAG.getNode(X86ISD::PCMPEQ, DL, MVT::v16i8, V,		V = DAG.getNode(X86ISD::PCMPEQ, DL, MVT::v16i8, V,
getZeroVector(MVT::v16i8, Subtarget, DAG, DL));		getZeroVector(MVT::v16i8, Subtarget, DAG, DL));
V = DAG.getNode(X86ISD::MOVMSK, DL, MVT::i32, V);		V = DAG.getNode(X86ISD::MOVMSK, DL, MVT::i32, V);
return DAG.getNode(X86ISD::CMP, DL, MVT::i32, V,		return DAG.getNode(X86ISD::CMP, DL, MVT::i32, V,
DAG.getConstant(0xFFFF, DL, MVT::i32));		DAG.getConstant(0xFFFF, DL, MVT::i32));
}		}

// Check whether an OR'd tree is PTEST-able, or if we can fallback to		// Check whether an OR'd reduction tree is PTEST-able, or if we can fallback to
// CMP(MOVMSK(PCMPEQB(X,0))).		// CMP(MOVMSK(PCMPEQB(X,0))).
		spatelUnsubmitted Not Done Reply Inline Actions Can we assert that CC is ISD::SETEQ or ISD::SETNE here? spatel: Can we assert that CC is ISD::SETEQ or ISD::SETNE here?
static SDValue MatchVectorAllZeroTest(SDValue Op, ISD::CondCode CC,		static SDValue MatchVectorAllZeroTest(SDValue Op, ISD::CondCode CC,
		const SDLoc &DL,
const X86Subtarget &Subtarget,		const X86Subtarget &Subtarget,
SelectionDAG &DAG, SDValue &X86CC) {		SelectionDAG &DAG, SDValue &X86CC) {
assert(Op.getOpcode() == ISD::OR && "Only check OR'd tree.");		assert((CC == ISD::SETEQ \|\| CC == ISD::SETNE) && "Unsupported ISD::CondCode");

if (!Subtarget.hasSSE2() \|\| !Op->hasOneUse())		if (!Subtarget.hasSSE2() \|\| !Op->hasOneUse())
return SDValue();		return SDValue();

SmallVector<SDValue, 8> VecIns;		SmallVector<SDValue, 8> VecIns;
if (matchScalarReduction(Op, ISD::OR, VecIns)) {		if (Op.getOpcode() == ISD::OR && matchScalarReduction(Op, ISD::OR, VecIns)) {
EVT VT = VecIns[0].getValueType();		EVT VT = VecIns[0].getValueType();
assert(llvm::all_of(VecIns,		assert(llvm::all_of(VecIns,
[VT](SDValue V) { return VT == V.getValueType(); }) &&		[VT](SDValue V) { return VT == V.getValueType(); }) &&
"Reduction source vector mismatch");		"Reduction source vector mismatch");

// Quit if less than 128-bits or not splittable to 128/256-bit vector.		// Quit if less than 128-bits or not splittable to 128/256-bit vector.
if (VT.getSizeInBits() < 128 \|\| !isPowerOf2_32(VT.getSizeInBits()))		if (VT.getSizeInBits() < 128 \|\| !isPowerOf2_32(VT.getSizeInBits()))
return SDValue();		return SDValue();

SDLoc DL(Op);

// If more than one full vector is evaluated, OR them first before PTEST.		// If more than one full vector is evaluated, OR them first before PTEST.
for (unsigned Slot = 0, e = VecIns.size(); e - Slot > 1;		for (unsigned Slot = 0, e = VecIns.size(); e - Slot > 1;
Slot += 2, e += 1) {		Slot += 2, e += 1) {
// Each iteration will OR 2 nodes and append the result until there is		// Each iteration will OR 2 nodes and append the result until there is
// only 1 node left, i.e. the final OR'd value of all vectors.		// only 1 node left, i.e. the final OR'd value of all vectors.
SDValue LHS = VecIns[Slot];		SDValue LHS = VecIns[Slot];
SDValue RHS = VecIns[Slot + 1];		SDValue RHS = VecIns[Slot + 1];
VecIns.push_back(DAG.getNode(ISD::OR, DL, VT, LHS, RHS));		VecIns.push_back(DAG.getNode(ISD::OR, DL, VT, LHS, RHS));
}		}

X86::CondCode CCode;		X86::CondCode CCode;
if (SDValue V =		if (SDValue V =
LowerVectorAllZero(DL, VecIns.back(), CC, Subtarget, DAG, CCode)) {		LowerVectorAllZero(DL, VecIns.back(), CC, Subtarget, DAG, CCode)) {
X86CC = DAG.getTargetConstant(CCode, DL, MVT::i8);		X86CC = DAG.getTargetConstant(CCode, DL, MVT::i8);
return V;		return V;
}		}
}		}

		if (Op.getOpcode() == ISD::EXTRACT_VECTOR_ELT) {
		ISD::NodeType BinOp;
		if (SDValue Match =
		DAG.matchBinOpReduction(Op.getNode(), BinOp, {ISD::OR})) {
		X86::CondCode CCode;
		if (SDValue V =
		LowerVectorAllZero(DL, Match, CC, Subtarget, DAG, CCode)) {
		X86CC = DAG.getTargetConstant(CCode, DL, MVT::i8);
		return V;
		}
		}
		}

return SDValue();		return SDValue();
}		}

/// return true if \c Op has a use that doesn't just read flags.		/// return true if \c Op has a use that doesn't just read flags.
static bool hasNonFlagsUse(SDValue Op) {		static bool hasNonFlagsUse(SDValue Op) {
for (SDNode::use_iterator UI = Op->use_begin(), UE = Op->use_end(); UI != UE;		for (SDNode::use_iterator UI = Op->use_begin(), UE = Op->use_end(); UI != UE;
++UI) {		++UI) {
SDNode User = UI;		SDNode User = UI;
▲ Show 20 Lines • Show All 1,134 Lines • ▼ Show 20 Lines	SDValue X86TargetLowering::emitFlagsForSetcc(SDValue Op0, SDValue Op1,
if (Op0.getOpcode() == ISD::AND && Op0.hasOneUse() && isNullConstant(Op1) &&		if (Op0.getOpcode() == ISD::AND && Op0.hasOneUse() && isNullConstant(Op1) &&
(CC == ISD::SETEQ \|\| CC == ISD::SETNE)) {		(CC == ISD::SETEQ \|\| CC == ISD::SETNE)) {
if (SDValue BT = LowerAndToBT(Op0, CC, dl, DAG, X86CC))		if (SDValue BT = LowerAndToBT(Op0, CC, dl, DAG, X86CC))
return BT;		return BT;
}		}

// Try to use PTEST/PMOVMSKB for a tree ORs equality compared with 0.		// Try to use PTEST/PMOVMSKB for a tree ORs equality compared with 0.
// TODO: We could do AND tree with all 1s as well by using the C flag.		// TODO: We could do AND tree with all 1s as well by using the C flag.
if (Op0.getOpcode() == ISD::OR && isNullConstant(Op1) &&		if (isNullConstant(Op1) && (CC == ISD::SETEQ \|\| CC == ISD::SETNE))
(CC == ISD::SETEQ \|\| CC == ISD::SETNE)) {		if (SDValue CmpZ =
if (SDValue CmpZ = MatchVectorAllZeroTest(Op0, CC, Subtarget, DAG, X86CC))		MatchVectorAllZeroTest(Op0, CC, dl, Subtarget, DAG, X86CC))
return CmpZ;		return CmpZ;
}

// Try to lower using KORTEST or KTEST.		// Try to lower using KORTEST or KTEST.
if (SDValue Test = EmitAVX512Test(Op0, Op1, CC, dl, DAG, Subtarget, X86CC))		if (SDValue Test = EmitAVX512Test(Op0, Op1, CC, dl, DAG, Subtarget, X86CC))
return Test;		return Test;

// Look for X == 0, X == 1, X != 0, or X != 1. We can simplify some forms of		// Look for X == 0, X == 1, X != 0, or X != 1. We can simplify some forms of
// these.		// these.
if ((isOneConstant(Op1) \|\| isNullConstant(Op1)) &&		if ((isOneConstant(Op1) \|\| isNullConstant(Op1)) &&
▲ Show 20 Lines • Show All 23,197 Lines • ▼ Show 20 Lines

/// Try to map a 128-bit or larger integer comparison to vector instructions		/// Try to map a 128-bit or larger integer comparison to vector instructions
/// before type legalization splits it up into chunks.		/// before type legalization splits it up into chunks.
static SDValue combineVectorSizedSetCCEquality(SDNode *SetCC, SelectionDAG &DAG,		static SDValue combineVectorSizedSetCCEquality(SDNode *SetCC, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
ISD::CondCode CC = cast<CondCodeSDNode>(SetCC->getOperand(2))->get();		ISD::CondCode CC = cast<CondCodeSDNode>(SetCC->getOperand(2))->get();
assert((CC == ISD::SETNE \|\| CC == ISD::SETEQ) && "Bad comparison predicate");		assert((CC == ISD::SETNE \|\| CC == ISD::SETEQ) && "Bad comparison predicate");

// We're looking for an oversized integer equality comparison.		// We're looking for an oversized integer equality comparison.
		spatelUnsubmitted Not Done Reply Inline Actions Code comments like this and the function name don't apply if we're matching a reduction, right? I think we need to refactor and/or update comments to reduce confusion. spatel: Code comments like this and the function name don't apply if we're matching a reduction, right?
SDValue X = SetCC->getOperand(0);		SDValue X = SetCC->getOperand(0);
SDValue Y = SetCC->getOperand(1);		SDValue Y = SetCC->getOperand(1);
EVT OpVT = X.getValueType();		EVT OpVT = X.getValueType();
unsigned OpSize = OpVT.getSizeInBits();		unsigned OpSize = OpVT.getSizeInBits();
if (!OpVT.isScalarInteger() \|\| OpSize < 128)		if (!OpVT.isScalarInteger() \|\| OpSize < 128)
return SDValue();		return SDValue();

// Ignore a comparison with zero because that gets special treatment in		// Ignore a comparison with zero because that gets special treatment in
▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines	static SDValue combineSetCC(SDNode *N, SelectionDAG &DAG,
const SDValue RHS = N->getOperand(1);		const SDValue RHS = N->getOperand(1);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT OpVT = LHS.getValueType();		EVT OpVT = LHS.getValueType();
SDLoc DL(N);		SDLoc DL(N);

if (CC == ISD::SETNE \|\| CC == ISD::SETEQ) {		if (CC == ISD::SETNE \|\| CC == ISD::SETEQ) {
if (SDValue V = combineVectorSizedSetCCEquality(N, DAG, Subtarget))		if (SDValue V = combineVectorSizedSetCCEquality(N, DAG, Subtarget))
return V;		return V;

		if (VT == MVT::i1) {
		SDValue X86CC;
		if (SDValue V =
		MatchVectorAllZeroTest(LHS, CC, DL, Subtarget, DAG, X86CC))
		return DAG.getNode(ISD::TRUNCATE, DL, VT,
		DAG.getNode(X86ISD::SETCC, DL, MVT::i8, X86CC, V));
		}
}		}

if (VT.isVector() && VT.getVectorElementType() == MVT::i1 &&		if (VT.isVector() && VT.getVectorElementType() == MVT::i1 &&
(CC == ISD::SETNE \|\| CC == ISD::SETEQ \|\| ISD::isSignedIntSetCC(CC))) {		(CC == ISD::SETNE \|\| CC == ISD::SETEQ \|\| ISD::isSignedIntSetCC(CC))) {
// Using temporaries to avoid messing up operand ordering for later		// Using temporaries to avoid messing up operand ordering for later
// transformations if this doesn't work.		// transformations if this doesn't work.
SDValue Op0 = LHS;		SDValue Op0 = LHS;
SDValue Op1 = RHS;		SDValue Op1 = RHS;
▲ Show 20 Lines • Show All 3,684 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pr45378.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse2 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse2 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse4.1 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse4.1 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2 \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2 \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512f \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512F			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512f \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512F
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512bw \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512bw \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512BW

	declare i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64>)			declare i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64>)

	define i1 @parseHeaders(i64 * %ptr) nounwind {			define i1 @parseHeaders(i64 * %ptr) nounwind {
				spatelUnsubmitted Not Done Reply Inline Actions Add 'nounwind' attribute to remove .cfi noise? Would it make sense to minimize the test to return the i1 icmp rather than branch and make an external call? spatel: Add 'nounwind' attribute to remove .cfi noise? Would it make sense to minimize the test to…
	; SSE-LABEL: parseHeaders:			; SSE2-LABEL: parseHeaders:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: movdqu (%rdi), %xmm0			; SSE2-NEXT: movdqu (%rdi), %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: movq %xmm1, %rax			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; AVX1-LABEL: parseHeaders:			; SSE41-LABEL: parseHeaders:
	; AVX1: # %bb.0:			; SSE41: # %bb.0:
	; AVX1-NEXT: vmovdqu (%rdi), %xmm0			; SSE41-NEXT: movdqu (%rdi), %xmm0
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE41-NEXT: ptest %xmm0, %xmm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; SSE41-NEXT: sete %al
	; AVX1-NEXT: vmovq %xmm0, %rax			; SSE41-NEXT: retq
	; AVX1-NEXT: testq %rax, %rax			;
	; AVX1-NEXT: sete %al			; AVX-LABEL: parseHeaders:
	; AVX1-NEXT: retq			; AVX: # %bb.0:
	;			; AVX-NEXT: vmovdqu (%rdi), %xmm0
	; AVX2-LABEL: parseHeaders:			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX2: # %bb.0:			; AVX-NEXT: sete %al
	; AVX2-NEXT: vpbroadcastq 8(%rdi), %xmm0			; AVX-NEXT: retq
	; AVX2-NEXT: vpor (%rdi), %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: sete %al
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: parseHeaders:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vpbroadcastq 8(%rdi), %xmm0
	; AVX512-NEXT: vpor (%rdi), %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: sete %al
	; AVX512-NEXT: retq
	%vptr = bitcast i64 * %ptr to <2 x i64> *			%vptr = bitcast i64 * %ptr to <2 x i64> *
	%vload = load <2 x i64>, <2 x i64> * %vptr, align 8			%vload = load <2 x i64>, <2 x i64> * %vptr, align 8
	%vreduce = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %vload)			%vreduce = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %vload)
	%vcheck = icmp eq i64 %vreduce, 0			%vcheck = icmp eq i64 %vreduce, 0
	ret i1 %vcheck			ret i1 %vcheck
	}			}

	define i1 @parseHeaders2_scalar_or(i64 * %ptr) nounwind {			define i1 @parseHeaders2_scalar_or(i64 * %ptr) nounwind {
	▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=SSE,SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=SSE,SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw \| FileCheck %s --check-prefixes=AVX,AVX512			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw \| FileCheck %s --check-prefixes=AVX,AVX512
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512

	;			;
	; vXi64			; vXi64
	;			;

	define i1 @test_v2i64(<2 x i64> %a0) {			define i1 @test_v2i64(<2 x i64> %a0) {
	; SSE-LABEL: test_v2i64:			; SSE2-LABEL: test_v2i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: movq %xmm1, %rax			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v2i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %a0)
	%2 = icmp eq i64 %1, 0			%2 = icmp eq i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i64(<4 x i64> %a0) {			define i1 @test_v4i64(<4 x i64> %a0) {
	; SSE-LABEL: test_v4i64:			; SSE2-LABEL: test_v4i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: movq %xmm1, %rax			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: setne %al			; SSE2-NEXT: setne %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v4i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm1, %xmm0
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: setne %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: testq %rax, %rax
	; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v4i64:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v4i64(<4 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v4i64(<4 x i64> %a0)
	%2 = icmp ne i64 %1, 0			%2 = icmp ne i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i64(<8 x i64> %a0) {			define i1 @test_v8i64(<8 x i64> %a0) {
	; SSE-LABEL: test_v8i64:			; SSE2-LABEL: test_v8i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: movq %xmm0, %rax			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v8i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm3, %xmm1
				; SSE41-NEXT: por %xmm2, %xmm1
				; SSE41-NEXT: por %xmm0, %xmm1
				; SSE41-NEXT: ptest %xmm1, %xmm1
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: testq %rax, %rax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v8i64:			; AVX512-LABEL: test_v8i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v8i64(<8 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v8i64(<8 x i64> %a0)
	%2 = icmp eq i64 %1, 0			%2 = icmp eq i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i64(<16 x i64> %a0) {			define i1 @test_v16i64(<16 x i64> %a0) {
	; SSE-LABEL: test_v16i64:			; SSE2-LABEL: test_v16i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: movq %xmm0, %rax			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: setne %al			; SSE2-NEXT: setne %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v16i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm7, %xmm3
				; SSE41-NEXT: por %xmm5, %xmm3
				; SSE41-NEXT: por %xmm1, %xmm3
				; SSE41-NEXT: por %xmm6, %xmm2
				; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: testq %rax, %rax
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i64:			; AVX512-LABEL: test_v16i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v16i64(<16 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v16i64(<16 x i64> %a0)
	%2 = icmp ne i64 %1, 0			%2 = icmp ne i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	;			;
	; vXi32			; vXi32
	;			;

	define i1 @test_v2i32(<2 x i32> %a0) {			define i1 @test_v2i32(<2 x i32> %a0) {
	; SSE-LABEL: test_v2i32:			; SSE-LABEL: test_v2i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE-NEXT: movq %xmm0, %rax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE-NEXT: testq %rax, %rax
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i32:			; AVX-LABEL: test_v2i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v2i32(<2 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v2i32(<2 x i32> %a0)
	%2 = icmp eq i32 %1, 0			%2 = icmp eq i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i32(<4 x i32> %a0) {			define i1 @test_v4i32(<4 x i32> %a0) {
	; SSE-LABEL: test_v4i32:			; SSE2-LABEL: test_v4i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm0, %eax			; SSE2-NEXT: setne %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: setne %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v4i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i32:			; AVX-LABEL: test_v4i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v4i32(<4 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v4i32(<4 x i32> %a0)
	%2 = icmp ne i32 %1, 0			%2 = icmp ne i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i32(<8 x i32> %a0) {			define i1 @test_v8i32(<8 x i32> %a0) {
	; SSE-LABEL: test_v8i32:			; SSE2-LABEL: test_v8i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm0, %eax			; SSE2-NEXT: sete %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: sete %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v8i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm1, %xmm0
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i32:			; AVX-LABEL: test_v8i32:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: sete %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testl %eax, %eax
	; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v8i32:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testl %eax, %eax
	; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v8i32:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testl %eax, %eax
	; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v8i32(<8 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v8i32(<8 x i32> %a0)
	%2 = icmp eq i32 %1, 0			%2 = icmp eq i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i32(<16 x i32> %a0) {			define i1 @test_v16i32(<16 x i32> %a0) {
	; SSE-LABEL: test_v16i32:			; SSE2-LABEL: test_v16i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm1, %eax			; SSE2-NEXT: setne %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: setne %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v16i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm3, %xmm1
				; SSE41-NEXT: por %xmm2, %xmm1
				; SSE41-NEXT: por %xmm0, %xmm1
				; SSE41-NEXT: ptest %xmm1, %xmm1
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i32:			; AVX1-LABEL: test_v16i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testl %eax, %eax
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i32:			; AVX2-LABEL: test_v16i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testl %eax, %eax
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i32:			; AVX512-LABEL: test_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testl %eax, %eax
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v16i32(<16 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v16i32(<16 x i32> %a0)
	%2 = icmp ne i32 %1, 0			%2 = icmp ne i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v32i32(<32 x i32> %a0) {			define i1 @test_v32i32(<32 x i32> %a0) {
	; SSE-LABEL: test_v32i32:			; SSE2-LABEL: test_v32i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm1, %eax			; SSE2-NEXT: sete %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: sete %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v32i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm7, %xmm3
				; SSE41-NEXT: por %xmm5, %xmm3
				; SSE41-NEXT: por %xmm1, %xmm3
				; SSE41-NEXT: por %xmm6, %xmm2
				; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v32i32:			; AVX1-LABEL: test_v32i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testl %eax, %eax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v32i32:			; AVX2-LABEL: test_v32i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testl %eax, %eax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i32:			; AVX512-LABEL: test_v32i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testl %eax, %eax
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v32i32(<32 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v32i32(<32 x i32> %a0)
	%2 = icmp eq i32 %1, 0			%2 = icmp eq i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	;			;
	; vXi16			; vXi16
	;			;

	define i1 @test_v2i16(<2 x i16> %a0) {			define i1 @test_v2i16(<2 x i16> %a0) {
	; SSE-LABEL: test_v2i16:			; SSE-LABEL: test_v2i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: psrld $16, %xmm1			; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i16:			; AVX-LABEL: test_v2i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testw %ax, %ax			; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v2i16(<2 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v2i16(<2 x i16> %a0)
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i16(<4 x i16> %a0) {			define i1 @test_v4i16(<4 x i16> %a0) {
	; SSE-LABEL: test_v4i16:			; SSE-LABEL: test_v4i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE-NEXT: movq %xmm0, %rax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE-NEXT: testq %rax, %rax
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: psrld $16, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: setne %al			; SSE-NEXT: setne %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i16:			; AVX-LABEL: test_v4i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v4i16(<4 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v4i16(<4 x i16> %a0)
	%2 = icmp ne i16 %1, 0			%2 = icmp ne i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i16(<8 x i16> %a0) {			define i1 @test_v8i16(<8 x i16> %a0) {
	; SSE-LABEL: test_v8i16:			; SSE2-LABEL: test_v8i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-LABEL: test_v8i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: sete %al			; SSE41-NEXT: ptest %xmm0, %xmm0
	; SSE-NEXT: retq			; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8i16:			; AVX-LABEL: test_v8i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v8i16(<8 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v8i16(<8 x i16> %a0)
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i16(<16 x i16> %a0) {			define i1 @test_v16i16(<16 x i16> %a0) {
	; SSE-LABEL: test_v16i16:			; SSE2-LABEL: test_v16i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-LABEL: test_v16i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: setne %al			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i16:			; AVX-LABEL: test_v16i16:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: setne %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v16i16:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v16i16:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testw %ax, %ax
	; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v16i16(<16 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v16i16(<16 x i16> %a0)
	%2 = icmp ne i16 %1, 0			%2 = icmp ne i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v32i16(<32 x i16> %a0) {			define i1 @test_v32i16(<32 x i16> %a0) {
	; SSE-LABEL: test_v32i16:			; SSE2-LABEL: test_v32i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-LABEL: test_v32i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: sete %al			; SSE41-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: retq			; SSE41-NEXT: por %xmm2, %xmm1
				; SSE41-NEXT: por %xmm0, %xmm1
				; SSE41-NEXT: ptest %xmm1, %xmm1
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v32i16:			; AVX1-LABEL: test_v32i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v32i16:			; AVX2-LABEL: test_v32i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i16:			; AVX512-LABEL: test_v32i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testw %ax, %ax
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v32i16(<32 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v32i16(<32 x i16> %a0)
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v64i16(<64 x i16> %a0) {			define i1 @test_v64i16(<64 x i16> %a0) {
	; SSE-LABEL: test_v64i16:			; SSE2-LABEL: test_v64i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-LABEL: test_v64i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: setne %al			; SSE41-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: retq			; SSE41-NEXT: por %xmm5, %xmm3
				; SSE41-NEXT: por %xmm1, %xmm3
				; SSE41-NEXT: por %xmm6, %xmm2
				; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v64i16:			; AVX1-LABEL: test_v64i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v64i16:			; AVX2-LABEL: test_v64i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v64i16:			; AVX512-LABEL: test_v64i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testw %ax, %ax
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v64i16(<64 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v64i16(<64 x i16> %a0)
	%2 = icmp ne i16 %1, 0			%2 = icmp ne i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	;			;
	; vXi8			; vXi8
	;			;

	define i1 @test_v2i8(<2 x i8> %a0) {			define i1 @test_v2i8(<2 x i8> %a0) {
	; SSE-LABEL: test_v2i8:			; SSE-LABEL: test_v2i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: psrlw $8, %xmm1			; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testb %al, %al
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i8:			; AVX-LABEL: test_v2i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v2i8(<2 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v2i8(<2 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i8(<4 x i8> %a0) {			define i1 @test_v4i8(<4 x i8> %a0) {
	; SSE-LABEL: test_v4i8:			; SSE-LABEL: test_v4i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: psrlw $8, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movd %xmm0, %eax			; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: testb %al, %al			; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: setne %al			; SSE-NEXT: setne %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i8:			; AVX-LABEL: test_v4i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v4i8(<4 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v4i8(<4 x i8> %a0)
	%2 = icmp ne i8 %1, 0			%2 = icmp ne i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i8(<8 x i8> %a0) {			define i1 @test_v8i8(<8 x i8> %a0) {
	; SSE-LABEL: test_v8i8:			; SSE-LABEL: test_v8i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE-NEXT: movq %xmm0, %rax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE-NEXT: testq %rax, %rax
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: psrld $16, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrlw $8, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testb %al, %al
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8i8:			; AVX-LABEL: test_v8i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v8i8(<8 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v8i8(<8 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i8(<16 x i8> %a0) {			define i1 @test_v16i8(<16 x i8> %a0) {
	; SSE-LABEL: test_v16i8:			; SSE2-LABEL: test_v16i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE41-LABEL: test_v16i8:
	; SSE-NEXT: psrlw $8, %xmm0			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: ptest %xmm0, %xmm0
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-NEXT: setne %al
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: retq
	; SSE-NEXT: setne %al
	; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v16i8:			; AVX-LABEL: test_v16i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v16i8(<16 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v16i8(<16 x i8> %a0)
	%2 = icmp ne i8 %1, 0			%2 = icmp ne i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v32i8(<32 x i8> %a0) {			define i1 @test_v32i8(<32 x i8> %a0) {
	; SSE-LABEL: test_v32i8:			; SSE2-LABEL: test_v32i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE41-LABEL: test_v32i8:
	; SSE-NEXT: psrlw $8, %xmm0			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-NEXT: ptest %xmm0, %xmm0
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: sete %al
	; SSE-NEXT: sete %al			; SSE41-NEXT: retq
	; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: test_v32i8:			; AVX-LABEL: test_v32i8:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: sete %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testb %al, %al
	; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v32i8:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v32i8:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v32i8(<32 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v32i8(<32 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v64i8(<64 x i8> %a0) {			define i1 @test_v64i8(<64 x i8> %a0) {
	; SSE-LABEL: test_v64i8:			; SSE2-LABEL: test_v64i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE41-LABEL: test_v64i8:
	; SSE-NEXT: psrlw $8, %xmm1			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm0, %xmm1			; SSE41-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: setne %al			; SSE41-NEXT: ptest %xmm1, %xmm1
	; SSE-NEXT: retq			; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v64i8:			; AVX1-LABEL: test_v64i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testb %al, %al
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v64i8:			; AVX2-LABEL: test_v64i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v64i8:			; AVX512-LABEL: test_v64i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v64i8(<64 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v64i8(<64 x i8> %a0)
	%2 = icmp ne i8 %1, 0			%2 = icmp ne i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v128i8(<128 x i8> %a0) {			define i1 @test_v128i8(<128 x i8> %a0) {
	; SSE-LABEL: test_v128i8:			; SSE2-LABEL: test_v128i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE41-LABEL: test_v128i8:
	; SSE-NEXT: psrlw $8, %xmm1			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm0, %xmm1			; SSE41-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: sete %al			; SSE41-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: retq			; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v128i8:			; AVX1-LABEL: test_v128i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testb %al, %al
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v128i8:			; AVX2-LABEL: test_v128i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v128i8:			; AVX512-LABEL: test_v128i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v128i8(<128 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v128i8(<128 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	Show All 25 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE] MatchVectorAllZeroTest - handle OR vector reductions
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 270987

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/pr45378.ll

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE] MatchVectorAllZeroTest - handle OR vector reductionsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 270987

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/pr45378.ll

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

[X86][SSE] MatchVectorAllZeroTest - handle OR vector reductions
ClosedPublic