Diff 270761

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 9,991 Lines • ▼ Show 20 Lines
	}			}

	// Helper function for comparing all bits of a vector against zero.			// Helper function for comparing all bits of a vector against zero.
	static SDValue LowerVectorAllZero(const SDLoc &DL, SDValue V, ISD::CondCode CC,			static SDValue LowerVectorAllZero(const SDLoc &DL, SDValue V, ISD::CondCode CC,
	const X86Subtarget &Subtarget,			const X86Subtarget &Subtarget,
	SelectionDAG &DAG, X86::CondCode &X86CC) {			SelectionDAG &DAG, X86::CondCode &X86CC) {
	EVT VT = V.getValueType();			EVT VT = V.getValueType();

	// Quit if less than 128-bits or not splittable to 128/256-bit vector.
	if (VT.getSizeInBits() < 128 \|\| !isPowerOf2_32(VT.getSizeInBits()))
	return SDValue();

	X86CC = (CC == ISD::SETEQ ? X86::COND_E : X86::COND_NE);			X86CC = (CC == ISD::SETEQ ? X86::COND_E : X86::COND_NE);

				// For sub-128-bit vector, cast to (legal) integer and compare with zero.
				if (VT.getSizeInBits() < 128) {
				EVT IntVT = EVT::getIntegerVT(*DAG.getContext(), VT.getSizeInBits());
				if (!DAG.getTargetLoweringInfo().isTypeLegal(IntVT))
				return SDValue();
				return DAG.getNode(X86ISD::CMP, DL, MVT::i32, DAG.getBitcast(IntVT, V),
				DAG.getConstant(0, DL, IntVT));
				}

				// Quit if not splittable to 128/256-bit vector.
				if (!isPowerOf2_32(VT.getSizeInBits()))
				return SDValue();

	// Split down to 128/256-bit vector.			// Split down to 128/256-bit vector.
	unsigned TestSize = Subtarget.hasAVX() ? 256 : 128;			unsigned TestSize = Subtarget.hasAVX() ? 256 : 128;
	while (VT.getSizeInBits() > TestSize) {			while (VT.getSizeInBits() > TestSize) {
	auto Split = DAG.SplitVector(V, DL);			auto Split = DAG.SplitVector(V, DL);
	VT = Split.first.getValueType();			VT = Split.first.getValueType();
	V = DAG.getNode(ISD::OR, DL, VT, Split.first, Split.second);			V = DAG.getNode(ISD::OR, DL, VT, Split.first, Split.second);
	}			}

	bool UsePTEST = Subtarget.hasSSE41();			bool UsePTEST = Subtarget.hasSSE41();
	if (UsePTEST) {			if (UsePTEST) {
	MVT TestVT = VT.is128BitVector() ? MVT::v2i64 : MVT::v4i64;			MVT TestVT = VT.is128BitVector() ? MVT::v2i64 : MVT::v4i64;
	V = DAG.getBitcast(TestVT, V);			V = DAG.getBitcast(TestVT, V);
	return DAG.getNode(X86ISD::PTEST, DL, MVT::i32, V, V);			return DAG.getNode(X86ISD::PTEST, DL, MVT::i32, V, V);
	}			}

	V = DAG.getBitcast(MVT::v16i8, V);			V = DAG.getBitcast(MVT::v16i8, V);
	V = DAG.getNode(X86ISD::PCMPEQ, DL, MVT::v16i8, V,			V = DAG.getNode(X86ISD::PCMPEQ, DL, MVT::v16i8, V,
	getZeroVector(MVT::v16i8, Subtarget, DAG, DL));			getZeroVector(MVT::v16i8, Subtarget, DAG, DL));
	V = DAG.getNode(X86ISD::MOVMSK, DL, MVT::i32, V);			V = DAG.getNode(X86ISD::MOVMSK, DL, MVT::i32, V);
	return DAG.getNode(X86ISD::CMP, DL, MVT::i32, V,			return DAG.getNode(X86ISD::CMP, DL, MVT::i32, V,
	DAG.getConstant(0xFFFF, DL, MVT::i32));			DAG.getConstant(0xFFFF, DL, MVT::i32));
	}			}

	// Check whether an OR'd tree is PTEST-able, or if we can fallback to			// Check whether an OR'd reduction tree is PTEST-able, or if we can fallback to
	// CMP(MOVMSK(PCMPEQB(X,0))).			// CMP(MOVMSK(PCMPEQB(X,0))).
	static SDValue MatchVectorAllZeroTest(SDValue Op, ISD::CondCode CC,			static SDValue MatchVectorAllZeroTest(SDValue Op, ISD::CondCode CC,
				spatelUnsubmitted Not Done Reply Inline Actions Can we assert that CC is ISD::SETEQ or ISD::SETNE here? spatel: Can we assert that CC is ISD::SETEQ or ISD::SETNE here?
				const SDLoc &DL,
	const X86Subtarget &Subtarget,			const X86Subtarget &Subtarget,
	SelectionDAG &DAG, SDValue &X86CC) {			SelectionDAG &DAG, SDValue &X86CC) {
	assert(Op.getOpcode() == ISD::OR && "Only check OR'd tree.");

	if (!Subtarget.hasSSE2() \|\| !Op->hasOneUse())			if (!Subtarget.hasSSE2() \|\| !Op->hasOneUse())
	return SDValue();			return SDValue();

	SmallVector<SDValue, 8> VecIns;			SmallVector<SDValue, 8> VecIns;
	if (matchScalarReduction(Op, ISD::OR, VecIns)) {			if (Op.getOpcode() == ISD::OR && matchScalarReduction(Op, ISD::OR, VecIns)) {
	EVT VT = VecIns[0].getValueType();			EVT VT = VecIns[0].getValueType();
	assert(llvm::all_of(VecIns,			assert(llvm::all_of(VecIns,
	[VT](SDValue V) { return VT == V.getValueType(); }) &&			[VT](SDValue V) { return VT == V.getValueType(); }) &&
	"Reduction source vector mismatch");			"Reduction source vector mismatch");

	// Quit if less than 128-bits or not splittable to 128/256-bit vector.			// Quit if less than 128-bits or not splittable to 128/256-bit vector.
	if (VT.getSizeInBits() < 128 \|\| !isPowerOf2_32(VT.getSizeInBits()))			if (VT.getSizeInBits() < 128 \|\| !isPowerOf2_32(VT.getSizeInBits()))
	return SDValue();			return SDValue();

	SDLoc DL(Op);

	// If more than one full vector is evaluated, OR them first before PTEST.			// If more than one full vector is evaluated, OR them first before PTEST.
	for (unsigned Slot = 0, e = VecIns.size(); e - Slot > 1;			for (unsigned Slot = 0, e = VecIns.size(); e - Slot > 1;
	Slot += 2, e += 1) {			Slot += 2, e += 1) {
	// Each iteration will OR 2 nodes and append the result until there is			// Each iteration will OR 2 nodes and append the result until there is
	// only 1 node left, i.e. the final OR'd value of all vectors.			// only 1 node left, i.e. the final OR'd value of all vectors.
	SDValue LHS = VecIns[Slot];			SDValue LHS = VecIns[Slot];
	SDValue RHS = VecIns[Slot + 1];			SDValue RHS = VecIns[Slot + 1];
	VecIns.push_back(DAG.getNode(ISD::OR, DL, VT, LHS, RHS));			VecIns.push_back(DAG.getNode(ISD::OR, DL, VT, LHS, RHS));
	}			}

	X86::CondCode CCode;			X86::CondCode CCode;
	if (SDValue V =			if (SDValue V =
	LowerVectorAllZero(DL, VecIns.back(), CC, Subtarget, DAG, CCode)) {			LowerVectorAllZero(DL, VecIns.back(), CC, Subtarget, DAG, CCode)) {
	X86CC = DAG.getTargetConstant(CCode, DL, MVT::i8);			X86CC = DAG.getTargetConstant(CCode, DL, MVT::i8);
	return V;			return V;
	}			}
	}			}

				if (Op.getOpcode() == ISD::EXTRACT_VECTOR_ELT) {
				ISD::NodeType BinOp;
				if (SDValue Match =
				DAG.matchBinOpReduction(Op.getNode(), BinOp, {ISD::OR})) {
				X86::CondCode CCode;
				if (SDValue V =
				LowerVectorAllZero(DL, Match, CC, Subtarget, DAG, CCode)) {
				X86CC = DAG.getTargetConstant(CCode, DL, MVT::i8);
				return V;
				}
				}
				}

	return SDValue();			return SDValue();
	}			}

	/// return true if \c Op has a use that doesn't just read flags.			/// return true if \c Op has a use that doesn't just read flags.
	static bool hasNonFlagsUse(SDValue Op) {			static bool hasNonFlagsUse(SDValue Op) {
	for (SDNode::use_iterator UI = Op->use_begin(), UE = Op->use_end(); UI != UE;			for (SDNode::use_iterator UI = Op->use_begin(), UE = Op->use_end(); UI != UE;
	++UI) {			++UI) {
	SDNode User = UI;			SDNode User = UI;
	▲ Show 20 Lines • Show All 1,134 Lines • ▼ Show 20 Lines
	if (Op0.getOpcode() == ISD::AND && Op0.hasOneUse() && isNullConstant(Op1) &&			if (Op0.getOpcode() == ISD::AND && Op0.hasOneUse() && isNullConstant(Op1) &&
	(CC == ISD::SETEQ \|\| CC == ISD::SETNE)) {			(CC == ISD::SETEQ \|\| CC == ISD::SETNE)) {
	if (SDValue BT = LowerAndToBT(Op0, CC, dl, DAG, X86CC))			if (SDValue BT = LowerAndToBT(Op0, CC, dl, DAG, X86CC))
	return BT;			return BT;
	}			}

	// Try to use PTEST/PMOVMSKB for a tree ORs equality compared with 0.			// Try to use PTEST/PMOVMSKB for a tree ORs equality compared with 0.
	// TODO: We could do AND tree with all 1s as well by using the C flag.			// TODO: We could do AND tree with all 1s as well by using the C flag.
	if (Op0.getOpcode() == ISD::OR && isNullConstant(Op1) &&			if (isNullConstant(Op1) && (CC == ISD::SETEQ \|\| CC == ISD::SETNE))
	(CC == ISD::SETEQ \|\| CC == ISD::SETNE)) {			if (SDValue CmpZ =
	if (SDValue CmpZ = MatchVectorAllZeroTest(Op0, CC, Subtarget, DAG, X86CC))			MatchVectorAllZeroTest(Op0, CC, dl, Subtarget, DAG, X86CC))
	return CmpZ;			return CmpZ;
	}

	// Try to lower using KORTEST or KTEST.			// Try to lower using KORTEST or KTEST.
	if (SDValue Test = EmitAVX512Test(Op0, Op1, CC, dl, DAG, Subtarget, X86CC))			if (SDValue Test = EmitAVX512Test(Op0, Op1, CC, dl, DAG, Subtarget, X86CC))
	return Test;			return Test;

	// Look for X == 0, X == 1, X != 0, or X != 1. We can simplify some forms of			// Look for X == 0, X == 1, X != 0, or X != 1. We can simplify some forms of
	// these.			// these.
	if ((isOneConstant(Op1) \|\| isNullConstant(Op1)) &&			if ((isOneConstant(Op1) \|\| isNullConstant(Op1)) &&
	▲ Show 20 Lines • Show All 19,552 Lines • ▼ Show 20 Lines
	EVT SVT = VT.getVectorElementType();			EVT SVT = VT.getVectorElementType();
	if (SVT != MVT::i8 && SVT != MVT::i16 && SVT != MVT::i32 &&			if (SVT != MVT::i8 && SVT != MVT::i16 && SVT != MVT::i32 &&
	SVT != MVT::i64 && SVT != MVT::f32 && SVT != MVT::f64)			SVT != MVT::i64 && SVT != MVT::f32 && SVT != MVT::f64)
	return SDValue();			return SDValue();

	// We can only do this if the vector size in 256 bits or less.			// We can only do this if the vector size in 256 bits or less.
	unsigned Size = VT.getSizeInBits();			unsigned Size = VT.getSizeInBits();
	if (Size > 256 && Subtarget.useAVX512Regs())			if (Size > 256 && Subtarget.useAVX512Regs())
	return SDValue();			return SDValue();
				spatelUnsubmitted Not Done Reply Inline Actions Code comments like this and the function name don't apply if we're matching a reduction, right? I think we need to refactor and/or update comments to reduce confusion. spatel: Code comments like this and the function name don't apply if we're matching a reduction, right?

	// Don't fold if the condition code can't be handled by PCMPEQ/PCMPGT since			// Don't fold if the condition code can't be handled by PCMPEQ/PCMPGT since
	// that's the only integer compares with we have.			// that's the only integer compares with we have.
	ISD::CondCode CC = cast<CondCodeSDNode>(N0.getOperand(2))->get();			ISD::CondCode CC = cast<CondCodeSDNode>(N0.getOperand(2))->get();
	if (ISD::isUnsignedIntSetCC(CC))			if (ISD::isUnsignedIntSetCC(CC))
	return SDValue();			return SDValue();

	// Only do this combine if the extension will be fully consumed by the setcc.			// Only do this combine if the extension will be fully consumed by the setcc.
	▲ Show 20 Lines • Show All 413 Lines • ▼ Show 20 Lines
	const SDValue RHS = N->getOperand(1);			const SDValue RHS = N->getOperand(1);
	EVT VT = N->getValueType(0);			EVT VT = N->getValueType(0);
	EVT OpVT = LHS.getValueType();			EVT OpVT = LHS.getValueType();
	SDLoc DL(N);			SDLoc DL(N);

	if (CC == ISD::SETNE \|\| CC == ISD::SETEQ) {			if (CC == ISD::SETNE \|\| CC == ISD::SETEQ) {
	if (SDValue V = combineVectorSizedSetCCEquality(N, DAG, Subtarget))			if (SDValue V = combineVectorSizedSetCCEquality(N, DAG, Subtarget))
	return V;			return V;

				if (VT == MVT::i1) {
				SDValue X86CC;
				if (SDValue V =
				MatchVectorAllZeroTest(LHS, CC, DL, Subtarget, DAG, X86CC))
				return DAG.getNode(ISD::TRUNCATE, DL, VT,
				DAG.getNode(X86ISD::SETCC, DL, MVT::i8, X86CC, V));
				}
	}			}

	if (VT.isVector() && VT.getVectorElementType() == MVT::i1 &&			if (VT.isVector() && VT.getVectorElementType() == MVT::i1 &&
	(CC == ISD::SETNE \|\| CC == ISD::SETEQ \|\| ISD::isSignedIntSetCC(CC))) {			(CC == ISD::SETNE \|\| CC == ISD::SETEQ \|\| ISD::isSignedIntSetCC(CC))) {
	// Using temporaries to avoid messing up operand ordering for later			// Using temporaries to avoid messing up operand ordering for later
	// transformations if this doesn't work.			// transformations if this doesn't work.
	SDValue Op0 = LHS;			SDValue Op0 = LHS;
	SDValue Op1 = RHS;			SDValue Op1 = RHS;
	▲ Show 20 Lines • Show All 3,678 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pr45378.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse2 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse2 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse4.1 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse4.1 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2 \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2 \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1OR2,AVX2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512f \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512F			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512f \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512F
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512bw \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx512bw \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512BW

	declare i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64>)			declare i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64>)

	define i1 @parseHeaders(i64 * %ptr) nounwind {			define i1 @parseHeaders(i64 * %ptr) nounwind {
				spatelUnsubmitted Not Done Reply Inline Actions Add 'nounwind' attribute to remove .cfi noise? Would it make sense to minimize the test to return the i1 icmp rather than branch and make an external call? spatel: Add 'nounwind' attribute to remove .cfi noise? Would it make sense to minimize the test to…
	; SSE-LABEL: parseHeaders:			; SSE2-LABEL: parseHeaders:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: movdqu (%rdi), %xmm0			; SSE2-NEXT: movdqu (%rdi), %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: movq %xmm1, %rax			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; AVX1-LABEL: parseHeaders:			; SSE41-LABEL: parseHeaders:
	; AVX1: # %bb.0:			; SSE41: # %bb.0:
	; AVX1-NEXT: vmovdqu (%rdi), %xmm0			; SSE41-NEXT: movdqu (%rdi), %xmm0
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE41-NEXT: ptest %xmm0, %xmm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; SSE41-NEXT: sete %al
	; AVX1-NEXT: vmovq %xmm0, %rax			; SSE41-NEXT: retq
	; AVX1-NEXT: testq %rax, %rax			;
	; AVX1-NEXT: sete %al			; AVX-LABEL: parseHeaders:
	; AVX1-NEXT: retq			; AVX: # %bb.0:
	;			; AVX-NEXT: vmovdqu (%rdi), %xmm0
	; AVX2-LABEL: parseHeaders:			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX2: # %bb.0:			; AVX-NEXT: sete %al
	; AVX2-NEXT: vpbroadcastq 8(%rdi), %xmm0			; AVX-NEXT: retq
	; AVX2-NEXT: vpor (%rdi), %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: sete %al
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: parseHeaders:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vpbroadcastq 8(%rdi), %xmm0
	; AVX512-NEXT: vpor (%rdi), %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: sete %al
	; AVX512-NEXT: retq
	%vptr = bitcast i64 * %ptr to <2 x i64> *			%vptr = bitcast i64 * %ptr to <2 x i64> *
	%vload = load <2 x i64>, <2 x i64> * %vptr, align 8			%vload = load <2 x i64>, <2 x i64> * %vptr, align 8
	%vreduce = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %vload)			%vreduce = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %vload)
	%vcheck = icmp eq i64 %vreduce, 0			%vcheck = icmp eq i64 %vreduce, 0
	ret i1 %vcheck			ret i1 %vcheck
	}			}

	define i1 @parseHeaders2_scalar_or(i64 * %ptr) nounwind {			define i1 @parseHeaders2_scalar_or(i64 * %ptr) nounwind {
	▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=SSE,SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=SSE,SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw \| FileCheck %s --check-prefixes=AVX,AVX512			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw \| FileCheck %s --check-prefixes=AVX,AVX512
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512bw,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512

	;			;
	; vXi64			; vXi64
	;			;

	define i1 @test_v2i64(<2 x i64> %a0) {			define i1 @test_v2i64(<2 x i64> %a0) {
	; SSE-LABEL: test_v2i64:			; SSE2-LABEL: test_v2i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: movq %xmm1, %rax			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v2i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i64:			; AVX-LABEL: test_v2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v2i64(<2 x i64> %a0)
	%2 = icmp eq i64 %1, 0			%2 = icmp eq i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i64(<4 x i64> %a0) {			define i1 @test_v4i64(<4 x i64> %a0) {
	; SSE-LABEL: test_v4i64:			; SSE2-LABEL: test_v4i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: movq %xmm1, %rax			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: setne %al			; SSE2-NEXT: setne %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v4i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm1, %xmm0
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v4i64:			; AVX-LABEL: test_v4i64:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: setne %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: testq %rax, %rax
	; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v4i64:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v4i64:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v4i64(<4 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v4i64(<4 x i64> %a0)
	%2 = icmp ne i64 %1, 0			%2 = icmp ne i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i64(<8 x i64> %a0) {			define i1 @test_v8i64(<8 x i64> %a0) {
	; SSE-LABEL: test_v8i64:			; SSE2-LABEL: test_v8i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: movq %xmm0, %rax			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: sete %al			; SSE2-NEXT: sete %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v8i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm3, %xmm1
				; SSE41-NEXT: por %xmm2, %xmm1
				; SSE41-NEXT: por %xmm0, %xmm1
				; SSE41-NEXT: ptest %xmm1, %xmm1
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i64:			; AVX1-LABEL: test_v8i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: testq %rax, %rax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v8i64:			; AVX2-LABEL: test_v8i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v8i64:			; AVX512-LABEL: test_v8i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v8i64(<8 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v8i64(<8 x i64> %a0)
	%2 = icmp eq i64 %1, 0			%2 = icmp eq i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i64(<16 x i64> %a0) {			define i1 @test_v16i64(<16 x i64> %a0) {
	; SSE-LABEL: test_v16i64:			; SSE2-LABEL: test_v16i64:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: movq %xmm0, %rax			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: testq %rax, %rax			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: setne %al			; SSE2-NEXT: setne %al
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: test_v16i64:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm7, %xmm3
				; SSE41-NEXT: por %xmm5, %xmm3
				; SSE41-NEXT: por %xmm1, %xmm3
				; SSE41-NEXT: por %xmm6, %xmm2
				; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i64:			; AVX1-LABEL: test_v16i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: testq %rax, %rax
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i64:			; AVX2-LABEL: test_v16i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: testq %rax, %rax
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i64:			; AVX512-LABEL: test_v16i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: testq %rax, %rax
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i64 @llvm.experimental.vector.reduce.or.v16i64(<16 x i64> %a0)			%1 = call i64 @llvm.experimental.vector.reduce.or.v16i64(<16 x i64> %a0)
	%2 = icmp ne i64 %1, 0			%2 = icmp ne i64 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	;			;
	; vXi32			; vXi32
	;			;

	define i1 @test_v2i32(<2 x i32> %a0) {			define i1 @test_v2i32(<2 x i32> %a0) {
	; SSE-LABEL: test_v2i32:			; SSE-LABEL: test_v2i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE-NEXT: movq %xmm0, %rax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE-NEXT: testq %rax, %rax
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i32:			; AVX-LABEL: test_v2i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v2i32(<2 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v2i32(<2 x i32> %a0)
	%2 = icmp eq i32 %1, 0			%2 = icmp eq i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i32(<4 x i32> %a0) {			define i1 @test_v4i32(<4 x i32> %a0) {
	; SSE-LABEL: test_v4i32:			; SSE2-LABEL: test_v4i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm0, %eax			; SSE2-NEXT: setne %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: setne %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v4i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i32:			; AVX-LABEL: test_v4i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v4i32(<4 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v4i32(<4 x i32> %a0)
	%2 = icmp ne i32 %1, 0			%2 = icmp ne i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i32(<8 x i32> %a0) {			define i1 @test_v8i32(<8 x i32> %a0) {
	; SSE-LABEL: test_v8i32:			; SSE2-LABEL: test_v8i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm0, %eax			; SSE2-NEXT: sete %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: sete %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v8i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm1, %xmm0
				; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i32:			; AVX-LABEL: test_v8i32:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: sete %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testl %eax, %eax
	; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v8i32:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testl %eax, %eax
	; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v8i32:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testl %eax, %eax
	; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v8i32(<8 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v8i32(<8 x i32> %a0)
	%2 = icmp eq i32 %1, 0			%2 = icmp eq i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i32(<16 x i32> %a0) {			define i1 @test_v16i32(<16 x i32> %a0) {
	; SSE-LABEL: test_v16i32:			; SSE2-LABEL: test_v16i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm1, %eax			; SSE2-NEXT: setne %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: setne %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v16i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm3, %xmm1
				; SSE41-NEXT: por %xmm2, %xmm1
				; SSE41-NEXT: por %xmm0, %xmm1
				; SSE41-NEXT: ptest %xmm1, %xmm1
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i32:			; AVX1-LABEL: test_v16i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testl %eax, %eax
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v16i32:			; AVX2-LABEL: test_v16i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testl %eax, %eax
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v16i32:			; AVX512-LABEL: test_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testl %eax, %eax
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v16i32(<16 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v16i32(<16 x i32> %a0)
	%2 = icmp ne i32 %1, 0			%2 = icmp ne i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v32i32(<32 x i32> %a0) {			define i1 @test_v32i32(<32 x i32> %a0) {
	; SSE-LABEL: test_v32i32:			; SSE2-LABEL: test_v32i32:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movd %xmm1, %eax			; SSE2-NEXT: sete %al
	; SSE-NEXT: testl %eax, %eax			; SSE2-NEXT: retq
	; SSE-NEXT: sete %al			;
	; SSE-NEXT: retq			; SSE41-LABEL: test_v32i32:
				; SSE41: # %bb.0:
				; SSE41-NEXT: por %xmm7, %xmm3
				; SSE41-NEXT: por %xmm5, %xmm3
				; SSE41-NEXT: por %xmm1, %xmm3
				; SSE41-NEXT: por %xmm6, %xmm2
				; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v32i32:			; AVX1-LABEL: test_v32i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testl %eax, %eax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v32i32:			; AVX2-LABEL: test_v32i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testl %eax, %eax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i32:			; AVX512-LABEL: test_v32i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vpord %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testl %eax, %eax
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i32 @llvm.experimental.vector.reduce.or.v32i32(<32 x i32> %a0)			%1 = call i32 @llvm.experimental.vector.reduce.or.v32i32(<32 x i32> %a0)
	%2 = icmp eq i32 %1, 0			%2 = icmp eq i32 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	;			;
	; vXi16			; vXi16
	;			;

	define i1 @test_v2i16(<2 x i16> %a0) {			define i1 @test_v2i16(<2 x i16> %a0) {
	; SSE-LABEL: test_v2i16:			; SSE-LABEL: test_v2i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: psrld $16, %xmm1			; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i16:			; AVX-LABEL: test_v2i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testw %ax, %ax			; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v2i16(<2 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v2i16(<2 x i16> %a0)
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i16(<4 x i16> %a0) {			define i1 @test_v4i16(<4 x i16> %a0) {
	; SSE-LABEL: test_v4i16:			; SSE-LABEL: test_v4i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE-NEXT: movq %xmm0, %rax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE-NEXT: testq %rax, %rax
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: psrld $16, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: setne %al			; SSE-NEXT: setne %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i16:			; AVX-LABEL: test_v4i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v4i16(<4 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v4i16(<4 x i16> %a0)
	%2 = icmp ne i16 %1, 0			%2 = icmp ne i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i16(<8 x i16> %a0) {			define i1 @test_v8i16(<8 x i16> %a0) {
	; SSE-LABEL: test_v8i16:			; SSE2-LABEL: test_v8i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-LABEL: test_v8i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: sete %al			; SSE41-NEXT: ptest %xmm0, %xmm0
	; SSE-NEXT: retq			; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8i16:			; AVX-LABEL: test_v8i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v8i16(<8 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v8i16(<8 x i16> %a0)
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i16(<16 x i16> %a0) {			define i1 @test_v16i16(<16 x i16> %a0) {
	; SSE-LABEL: test_v16i16:			; SSE2-LABEL: test_v16i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-LABEL: test_v16i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: setne %al			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE41-NEXT: ptest %xmm0, %xmm0
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v16i16:			; AVX-LABEL: test_v16i16:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: setne %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v16i16:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v16i16:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testw %ax, %ax
	; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v16i16(<16 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v16i16(<16 x i16> %a0)
	%2 = icmp ne i16 %1, 0			%2 = icmp ne i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v32i16(<32 x i16> %a0) {			define i1 @test_v32i16(<32 x i16> %a0) {
	; SSE-LABEL: test_v32i16:			; SSE2-LABEL: test_v32i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-LABEL: test_v32i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: sete %al			; SSE41-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: retq			; SSE41-NEXT: por %xmm2, %xmm1
				; SSE41-NEXT: por %xmm0, %xmm1
				; SSE41-NEXT: ptest %xmm1, %xmm1
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v32i16:			; AVX1-LABEL: test_v32i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v32i16:			; AVX2-LABEL: test_v32i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v32i16:			; AVX512-LABEL: test_v32i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testw %ax, %ax
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v32i16(<32 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v32i16(<32 x i16> %a0)
	%2 = icmp eq i16 %1, 0			%2 = icmp eq i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v64i16(<64 x i16> %a0) {			define i1 @test_v64i16(<64 x i16> %a0) {
	; SSE-LABEL: test_v64i16:			; SSE2-LABEL: test_v64i16:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-LABEL: test_v64i16:
	; SSE-NEXT: testw %ax, %ax			; SSE41: # %bb.0:
	; SSE-NEXT: setne %al			; SSE41-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: retq			; SSE41-NEXT: por %xmm5, %xmm3
				; SSE41-NEXT: por %xmm1, %xmm3
				; SSE41-NEXT: por %xmm6, %xmm2
				; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v64i16:			; AVX1-LABEL: test_v64i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testw %ax, %ax
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v64i16:			; AVX2-LABEL: test_v64i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testw %ax, %ax
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v64i16:			; AVX512-LABEL: test_v64i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testw %ax, %ax
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i16 @llvm.experimental.vector.reduce.or.v64i16(<64 x i16> %a0)			%1 = call i16 @llvm.experimental.vector.reduce.or.v64i16(<64 x i16> %a0)
	%2 = icmp ne i16 %1, 0			%2 = icmp ne i16 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	;			;
	; vXi8			; vXi8
	;			;

	define i1 @test_v2i8(<2 x i8> %a0) {			define i1 @test_v2i8(<2 x i8> %a0) {
	; SSE-LABEL: test_v2i8:			; SSE-LABEL: test_v2i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: psrlw $8, %xmm1			; SSE-NEXT: testw %ax, %ax
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testb %al, %al
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i8:			; AVX-LABEL: test_v2i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testw %ax, %ax
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v2i8(<2 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v2i8(<2 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v4i8(<4 x i8> %a0) {			define i1 @test_v4i8(<4 x i8> %a0) {
	; SSE-LABEL: test_v4i8:			; SSE-LABEL: test_v4i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrld $16, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: psrlw $8, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movd %xmm0, %eax			; SSE-NEXT: movd %xmm0, %eax
	; SSE-NEXT: testb %al, %al			; SSE-NEXT: testl %eax, %eax
	; SSE-NEXT: setne %al			; SSE-NEXT: setne %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i8:			; AVX-LABEL: test_v4i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al			; AVX-NEXT: testl %eax, %eax
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v4i8(<4 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v4i8(<4 x i8> %a0)
	%2 = icmp ne i8 %1, 0			%2 = icmp ne i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v8i8(<8 x i8> %a0) {			define i1 @test_v8i8(<8 x i8> %a0) {
	; SSE-LABEL: test_v8i8:			; SSE-LABEL: test_v8i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE-NEXT: movq %xmm0, %rax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE-NEXT: testq %rax, %rax
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: psrld $16, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrlw $8, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: movd %xmm1, %eax
	; SSE-NEXT: testb %al, %al
	; SSE-NEXT: sete %al			; SSE-NEXT: sete %al
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8i8:			; AVX-LABEL: test_v8i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; AVX-NEXT: vmovq %xmm0, %rax
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: testq %rax, %rax
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al
	; AVX-NEXT: sete %al			; AVX-NEXT: sete %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v8i8(<8 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v8i8(<8 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v16i8(<16 x i8> %a0) {			define i1 @test_v16i8(<16 x i8> %a0) {
	; SSE-LABEL: test_v16i8:			; SSE2-LABEL: test_v16i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE41-LABEL: test_v16i8:
	; SSE-NEXT: psrlw $8, %xmm0			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: ptest %xmm0, %xmm0
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-NEXT: setne %al
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: retq
	; SSE-NEXT: setne %al
	; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v16i8:			; AVX-LABEL: test_v16i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vptest %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovd %xmm0, %eax
	; AVX-NEXT: testb %al, %al
	; AVX-NEXT: setne %al			; AVX-NEXT: setne %al
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v16i8(<16 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v16i8(<16 x i8> %a0)
	%2 = icmp ne i8 %1, 0			%2 = icmp ne i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v32i8(<32 x i8> %a0) {			define i1 @test_v32i8(<32 x i8> %a0) {
	; SSE-LABEL: test_v32i8:			; SSE2-LABEL: test_v32i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm1, %eax
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm1			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm0, %xmm1			;
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE41-LABEL: test_v32i8:
	; SSE-NEXT: psrlw $8, %xmm0			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE-NEXT: movd %xmm0, %eax			; SSE41-NEXT: ptest %xmm0, %xmm0
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: sete %al
	; SSE-NEXT: sete %al			; SSE41-NEXT: retq
	; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: test_v32i8:			; AVX-LABEL: test_v32i8:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: sete %al
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; AVX-NEXT: vzeroupper
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testb %al, %al
	; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: test_v32i8:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: test_v32i8:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v32i8(<32 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v32i8(<32 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v64i8(<64 x i8> %a0) {			define i1 @test_v64i8(<64 x i8> %a0) {
	; SSE-LABEL: test_v64i8:			; SSE2-LABEL: test_v64i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: setne %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE41-LABEL: test_v64i8:
	; SSE-NEXT: psrlw $8, %xmm1			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm0, %xmm1			; SSE41-NEXT: por %xmm3, %xmm1
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: por %xmm0, %xmm1
	; SSE-NEXT: setne %al			; SSE41-NEXT: ptest %xmm1, %xmm1
	; SSE-NEXT: retq			; SSE41-NEXT: setne %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v64i8:			; AVX1-LABEL: test_v64i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testb %al, %al
	; AVX1-NEXT: setne %al			; AVX1-NEXT: setne %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v64i8:			; AVX2-LABEL: test_v64i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: setne %al			; AVX2-NEXT: setne %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v64i8:			; AVX512-LABEL: test_v64i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: setne %al			; AVX512-NEXT: setne %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v64i8(<64 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v64i8(<64 x i8> %a0)
	%2 = icmp ne i8 %1, 0			%2 = icmp ne i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	define i1 @test_v128i8(<128 x i8> %a0) {			define i1 @test_v128i8(<128 x i8> %a0) {
	; SSE-LABEL: test_v128i8:			; SSE2-LABEL: test_v128i8:
	; SSE: # %bb.0:			; SSE2: # %bb.0:
	; SSE-NEXT: por %xmm6, %xmm2			; SSE2-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: por %xmm7, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm0, %xmm2
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[2,3,0,1]			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]			; SSE2-NEXT: pmovmskb %xmm0, %eax
	; SSE-NEXT: por %xmm0, %xmm1			; SSE2-NEXT: cmpl $65535, %eax # imm = 0xFFFF
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: sete %al
	; SSE-NEXT: psrld $16, %xmm0			; SSE2-NEXT: retq
	; SSE-NEXT: por %xmm1, %xmm0			;
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE41-LABEL: test_v128i8:
	; SSE-NEXT: psrlw $8, %xmm1			; SSE41: # %bb.0:
	; SSE-NEXT: por %xmm0, %xmm1			; SSE41-NEXT: por %xmm7, %xmm3
	; SSE-NEXT: movd %xmm1, %eax			; SSE41-NEXT: por %xmm5, %xmm3
	; SSE-NEXT: testb %al, %al			; SSE41-NEXT: por %xmm1, %xmm3
	; SSE-NEXT: sete %al			; SSE41-NEXT: por %xmm6, %xmm2
	; SSE-NEXT: retq			; SSE41-NEXT: por %xmm4, %xmm2
				; SSE41-NEXT: por %xmm3, %xmm2
				; SSE41-NEXT: por %xmm0, %xmm2
				; SSE41-NEXT: ptest %xmm2, %xmm2
				; SSE41-NEXT: sete %al
				; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_v128i8:			; AVX1-LABEL: test_v128i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1			; AVX1-NEXT: vorps %ymm3, %ymm1, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1			; AVX1-NEXT: vorps %ymm1, %ymm2, %ymm1
	; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vptest %ymm0, %ymm0
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX1-NEXT: vorps %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX1-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vmovd %xmm0, %eax
	; AVX1-NEXT: testb %al, %al
	; AVX1-NEXT: sete %al			; AVX1-NEXT: sete %al
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_v128i8:			; AVX2-LABEL: test_v128i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1			; AVX2-NEXT: vpor %ymm3, %ymm1, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpor %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vptest %ymm0, %ymm0
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovd %xmm0, %eax
	; AVX2-NEXT: testb %al, %al
	; AVX2-NEXT: sete %al			; AVX2-NEXT: sete %al
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test_v128i8:			; AVX512-LABEL: test_v128i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm1
	; AVX512-NEXT: vporq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512-NEXT: vptest %ymm0, %ymm0
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrld $16, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsrlw $8, %xmm0, %xmm1
	; AVX512-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vmovd %xmm0, %eax
	; AVX512-NEXT: testb %al, %al
	; AVX512-NEXT: sete %al			; AVX512-NEXT: sete %al
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call i8 @llvm.experimental.vector.reduce.or.v128i8(<128 x i8> %a0)			%1 = call i8 @llvm.experimental.vector.reduce.or.v128i8(<128 x i8> %a0)
	%2 = icmp eq i8 %1, 0			%2 = icmp eq i8 %1, 0
	ret i1 %2			ret i1 %2
	}			}

	Show All 25 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE] MatchVectorAllZeroTest - handle OR vector reductions
ClosedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 270761

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/pr45378.ll

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE] MatchVectorAllZeroTest - handle OR vector reductionsClosedPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 270761

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/pr45378.ll

llvm/test/CodeGen/X86/vector-reduce-or-cmp.ll

[X86][SSE] MatchVectorAllZeroTest - handle OR vector reductions
ClosedPublic