This is an archive of the discontinued LLVM Phabricator instance.

[VE] Change the behaviour of truncate
ClosedPublic

Authored by kaz7 on Nov 27 2020, 6:10 AM.

Download Raw Diff

Details

Reviewers

simoll
k-ishizaka

Commits

rG44a679eaa40c: [VE] Change the behaviour of truncate

Summary

Change the way to truncate i64 to i32 in I64 registers. VE assumed
sext values previously. Change it to zext values this time to make
it match to the LLVM behaviour.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

kaz7 created this revision.Nov 27 2020, 6:10 AM

Herald added subscribers: llvm-commits, hiraditya. · View Herald TranscriptNov 27 2020, 6:10 AM

kaz7 requested review of this revision.Nov 27 2020, 6:10 AM

I understand this is necessary for VE ABI compliance. Is there anything in LLVM that says a truncate has to zero-out all leading bits?

Harbormaster completed remote builds in B80341: Diff 308035.Nov 27 2020, 7:06 AM

In D92226#2420115, @simoll wrote:

I understand this is necessary for VE ABI compliance. Is there anything in LLVM that says a truncate has to zero-out all leading bits?

Very good question I think. I've not found such documentations. But, it looks like LLVM assumes to zero-out all leading bits after truncate. For example, we have following optimization in DAGCombiner and this requires zero-out where logic_op is XOR.

// logic_op (truncate x), (truncate y) --> truncate (logic_op x, y)

I also see Mips64InstrInfo.td tries to one-out all leading bits after truncate (EDIT: this may not fit as an example of zero-out):

// truncate
def : MipsPat<(trunc (assertsext GPR64:$src)),
              (EXTRACT_SUBREG GPR64:$src, sub_32)>, ISA_MIPS3, GPR_64;
// The forward compatibility strategy employed by MIPS requires us to treat
// values as being sign extended to an infinite number of bits. This allows
// existing software to run without modification on any future MIPS
// implementation (e.g. 128-bit, or 1024-bit). Being compatible with this
// strategy requires that truncation acts as a sign-extension for values being
// fed into instructions operating on 32-bit values. Such instructions have
// undefined results if this is not true.
// For our case, this means that we can't issue an extract_subreg for nodes
// such as (trunc:i32 (assertzext:i64 X, i32)), because the sign-bit of the
// lower subreg would not be replicated into the upper half.
def : MipsPat<(trunc (assertzext_lt_i32 GPR64:$src)),
              (EXTRACT_SUBREG GPR64:$src, sub_32)>, ISA_MIPS3, GPR_64;
def : MipsPat<(i32 (trunc GPR64:$src)),
              (SLL (EXTRACT_SUBREG GPR64:$src, sub_32), 0)>, ISA_MIPS3, GPR_64;

Regarding to VE ABI. VE ABI is compilicated. It requires one-out for signed values and zero-out for unsigned values. Therefore, I made LLVM for VE uses one-out before (I was thinking about signed values only at that time). Recently, I modify clang for VE to pass all arguments in 64 bits and this fulfills VE's ABI. Therefore, I decide to change LLVM for VE to use zero-out by default.

In D92226#2420812, @kaz7 wrote:

Regarding to VE ABI. VE ABI is compilicated. It requires one-out for signed values and zero-out for unsigned values. Therefore, I made LLVM for VE uses one-out before (I was thinking about signed values only at that time). Recently, I modify clang for VE to pass all arguments in 64 bits and this fulfills VE's ABI. Therefore, I decide to change LLVM for VE to use zero-out by default.

Fair enough, then.

This revision is now accepted and ready to land.Nov 30 2020, 2:28 AM

Closed by commit rG44a679eaa40c: [VE] Change the behaviour of truncate (authored by kaz7). · Explain WhyNov 30 2020, 5:12 AM

This revision was automatically updated to reflect the committed changes.

kaz7 added a commit: rG44a679eaa40c: [VE] Change the behaviour of truncate.

Revision Contents

Path

Size

llvm/

lib/

Target/

VE/

VEInstrInfo.td

2 lines

test/

CodeGen/

VE/

Scalar/

br_jt.ll

48 lines

select.ll

42 lines

select_cc.ll

14 lines

VELIntrinsics/

lsv.ll

8 lines

lvlgen.ll

6 lines

vbrd.ll

6 lines

Vector/

vec_add.ll

87 lines

vec_broadcast.ll

266 lines

Diff 308330

llvm/lib/Target/VE/VEInstrInfo.td

Show First 20 Lines • Show All 1,650 Lines • ▼ Show 20 Lines	def : Pat<(sext_inreg I64:$src, i16),
(SRALri (SLLri $src, 48), 48)>;		(SRALri (SLLri $src, 48), 48)>;
def : Pat<(sext_inreg (i32 (trunc i64:$src)), i16),		def : Pat<(sext_inreg (i32 (trunc i64:$src)), i16),
(EXTRACT_SUBREG (SRALri (SLLri $src, 48), 48), sub_i32)>;		(EXTRACT_SUBREG (SRALri (SLLri $src, 48), 48), sub_i32)>;
def : Pat<(i32 (and (trunc i64:$src), 0xffff)),		def : Pat<(i32 (and (trunc i64:$src), 0xffff)),
(EXTRACT_SUBREG (ANDrm $src, !add(48, 64)), sub_i32)>;		(EXTRACT_SUBREG (ANDrm $src, !add(48, 64)), sub_i32)>;

// Cast to i32		// Cast to i32
def : Pat<(i32 (trunc i64:$src)),		def : Pat<(i32 (trunc i64:$src)),
(ADDSWSXrm (EXTRACT_SUBREG $src, sub_i32), 0)>;		(EXTRACT_SUBREG (ANDrm $src, !add(32, 64)), sub_i32)>;
def : Pat<(i32 (fp_to_sint f32:$src)), (CVTWSSXr RD_RZ, $src)>;		def : Pat<(i32 (fp_to_sint f32:$src)), (CVTWSSXr RD_RZ, $src)>;
def : Pat<(i32 (fp_to_sint f64:$src)), (CVTWDSXr RD_RZ, $src)>;		def : Pat<(i32 (fp_to_sint f64:$src)), (CVTWDSXr RD_RZ, $src)>;
def : Pat<(i32 (fp_to_sint f128:$src)), (CVTWDSXr RD_RZ, (CVTDQr $src))>;		def : Pat<(i32 (fp_to_sint f128:$src)), (CVTWDSXr RD_RZ, (CVTDQr $src))>;

// Cast to i64		// Cast to i64
def : Pat<(sext_inreg i64:$src, i32),		def : Pat<(sext_inreg i64:$src, i32),
(INSERT_SUBREG (i64 (IMPLICIT_DEF)),		(INSERT_SUBREG (i64 (IMPLICIT_DEF)),
(ADDSWSXrm (EXTRACT_SUBREG $src, sub_i32), 0), sub_i32)>;		(ADDSWSXrm (EXTRACT_SUBREG $src, sub_i32), 0), sub_i32)>;
▲ Show 20 Lines • Show All 582 Lines • Show Last 20 Lines

llvm/test/CodeGen/VE/Scalar/br_jt.ll

; RUN: llc < %s -mtriple=ve \| FileCheck %s		; RUN: llc < %s -mtriple=ve \| FileCheck %s
; RUN: llc < %s -mtriple=ve -relocation-model=pic \		; RUN: llc < %s -mtriple=ve -relocation-model=pic \
; RUN: \| FileCheck %s -check-prefix=PIC		; RUN: \| FileCheck %s -check-prefix=PIC

@switch.table.br_jt4 = private unnamed_addr constant [4 x i32] [i32 3, i32 0, i32 4, i32 7], align 4		@switch.table.br_jt4 = private unnamed_addr constant [4 x i32] [i32 3, i32 0, i32 4, i32 7], align 4
@switch.table.br_jt7 = private unnamed_addr constant [9 x i32] [i32 3, i32 0, i32 4, i32 7, i32 3, i32 3, i32 5, i32 11, i32 10], align 4		@switch.table.br_jt7 = private unnamed_addr constant [9 x i32] [i32 3, i32 0, i32 4, i32 7, i32 3, i32 3, i32 5, i32 11, i32 10], align 4
@switch.table.br_jt8 = private unnamed_addr constant [9 x i32] [i32 3, i32 0, i32 4, i32 7, i32 3, i32 1, i32 5, i32 11, i32 10], align 4		@switch.table.br_jt8 = private unnamed_addr constant [9 x i32] [i32 3, i32 0, i32 4, i32 7, i32 3, i32 1, i32 5, i32 11, i32 10], align 4

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt3(i32 signext %0) {		define signext i32 @br_jt3(i32 signext %0) {
; CHECK-LABEL: br_jt3:		; CHECK-LABEL: br_jt3:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: breq.w 1, %s0, .LBB{{[0-9]+}}_1		; CHECK-NEXT: breq.w 1, %s0, .LBB{{[0-9]+}}_1
; CHECK-NEXT: # %bb.2:		; CHECK-NEXT: # %bb.2:
; CHECK-NEXT: breq.w 4, %s0, .LBB{{[0-9]+}}_5		; CHECK-NEXT: breq.w 4, %s0, .LBB{{[0-9]+}}_5
; CHECK-NEXT: # %bb.3:		; CHECK-NEXT: # %bb.3:
; CHECK-NEXT: brne.w 2, %s0, .LBB{{[0-9]+}}_6		; CHECK-NEXT: brne.w 2, %s0, .LBB{{[0-9]+}}_6
; CHECK-NEXT: # %bb.4:		; CHECK-NEXT: # %bb.4:
; CHECK-NEXT: or %s0, 0, (0)1		; CHECK-NEXT: or %s0, 0, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_1:		; CHECK-NEXT: .LBB{{[0-9]+}}_1:
; CHECK-NEXT: or %s0, 3, (0)1		; CHECK-NEXT: or %s0, 3, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_5:		; CHECK-NEXT: .LBB{{[0-9]+}}_5:
; CHECK-NEXT: or %s0, 7, (0)1		; CHECK-NEXT: or %s0, 7, (0)1
; CHECK-NEXT: .LBB{{[0-9]+}}_6:		; CHECK-NEXT: .LBB{{[0-9]+}}_6:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt3:		; PIC-LABEL: br_jt3:
; PIC: # %bb.0:		; PIC: # %bb.0:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: breq.w 1, %s0, .LBB0_1		; PIC-NEXT: breq.w 1, %s0, .LBB0_1
; PIC-NEXT: # %bb.2:		; PIC-NEXT: # %bb.2:
; PIC-NEXT: breq.w 4, %s0, .LBB0_5		; PIC-NEXT: breq.w 4, %s0, .LBB0_5
; PIC-NEXT: # %bb.3:		; PIC-NEXT: # %bb.3:
; PIC-NEXT: brne.w 2, %s0, .LBB0_6		; PIC-NEXT: brne.w 2, %s0, .LBB0_6
; PIC-NEXT: # %bb.4:		; PIC-NEXT: # %bb.4:
; PIC-NEXT: or %s0, 0, (0)1		; PIC-NEXT: or %s0, 0, (0)1
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
Show All 26 Lines	5: ; preds = %1, %4, %3, %2
%6 = phi i32 [ %0, %4 ], [ 7, %3 ], [ 0, %2 ], [ 3, %1 ]		%6 = phi i32 [ %0, %4 ], [ 7, %3 ], [ 0, %2 ], [ 3, %1 ]
ret i32 %6		ret i32 %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt4(i32 signext %0) {		define signext i32 @br_jt4(i32 signext %0) {
; CHECK-LABEL: br_jt4:		; CHECK-LABEL: br_jt4:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: adds.w.sx %s1, -1, %s0		; CHECK-NEXT: adds.w.sx %s1, -1, %s0
; CHECK-NEXT: cmpu.w %s2, 3, %s1		; CHECK-NEXT: cmpu.w %s2, 3, %s1
; CHECK-NEXT: brgt.w 0, %s2, .LBB{{[0-9]+}}_2		; CHECK-NEXT: brgt.w 0, %s2, .LBB{{[0-9]+}}_2
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1
; CHECK-NEXT: sll %s0, %s0, 2		; CHECK-NEXT: sll %s0, %s0, 2
; CHECK-NEXT: lea %s1, .Lswitch.table.br_jt4@lo		; CHECK-NEXT: lea %s1, .Lswitch.table.br_jt4@lo
; CHECK-NEXT: and %s1, %s1, (32)0		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: lea.sl %s1, .Lswitch.table.br_jt4@hi(, %s1)		; CHECK-NEXT: lea.sl %s1, .Lswitch.table.br_jt4@hi(, %s1)
; CHECK-NEXT: ldl.sx %s0, (%s0, %s1)		; CHECK-NEXT: ldl.sx %s0, (%s0, %s1)
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_2:		; CHECK-NEXT: .LBB{{[0-9]+}}_2:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt4:		; PIC-LABEL: br_jt4:
; PIC: .LBB{{[0-9]+}}_5:		; PIC: .LBB{{[0-9]+}}_5:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: adds.w.sx %s1, -1, %s0		; PIC-NEXT: adds.w.sx %s1, -1, %s0
; PIC-NEXT: cmpu.w %s2, 3, %s1		; PIC-NEXT: cmpu.w %s2, 3, %s1
; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)		; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)
; PIC-NEXT: and %s15, %s15, (32)0		; PIC-NEXT: and %s15, %s15, (32)0
; PIC-NEXT: sic %s16		; PIC-NEXT: sic %s16
; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)		; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)
; PIC-NEXT: brgt.w 0, %s2, .LBB1_2		; PIC-NEXT: brgt.w 0, %s2, .LBB1_2
; PIC-NEXT: # %bb.1:		; PIC-NEXT: # %bb.1:
Show All 21 Lines
8: ; preds = %1		8: ; preds = %1
ret i32 %0		ret i32 %0
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt7(i32 signext %0) {		define signext i32 @br_jt7(i32 signext %0) {
; CHECK-LABEL: br_jt7:		; CHECK-LABEL: br_jt7:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: adds.w.sx %s1, -1, %s0		; CHECK-NEXT: adds.w.sx %s1, -1, %s0
; CHECK-NEXT: cmpu.w %s2, 8, %s1		; CHECK-NEXT: cmpu.w %s2, 8, %s1
; CHECK-NEXT: brgt.w 0, %s2, .LBB{{[0-9]+}}_3		; CHECK-NEXT: brgt.w 0, %s2, .LBB{{[0-9]+}}_3
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: and %s2, %s1, (48)0		; CHECK-NEXT: and %s2, %s1, (48)0
; CHECK-NEXT: lea %s3, 463		; CHECK-NEXT: lea %s3, 463
; CHECK-NEXT: and %s3, %s3, (32)0		; CHECK-NEXT: and %s3, %s3, (32)0
; CHECK-NEXT: srl %s2, %s3, %s2		; CHECK-NEXT: srl %s2, %s3, %s2
; CHECK-NEXT: and %s2, 1, %s2		; CHECK-NEXT: and %s2, 1, %s2
; CHECK-NEXT: brne.w 0, %s2, .LBB{{[0-9]+}}_2		; CHECK-NEXT: brne.w 0, %s2, .LBB{{[0-9]+}}_2
; CHECK-NEXT: .LBB{{[0-9]+}}_3:		; CHECK-NEXT: .LBB{{[0-9]+}}_3:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_2:		; CHECK-NEXT: .LBB{{[0-9]+}}_2:
; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1
; CHECK-NEXT: sll %s0, %s0, 2		; CHECK-NEXT: sll %s0, %s0, 2
; CHECK-NEXT: lea %s1, .Lswitch.table.br_jt7@lo		; CHECK-NEXT: lea %s1, .Lswitch.table.br_jt7@lo
; CHECK-NEXT: and %s1, %s1, (32)0		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: lea.sl %s1, .Lswitch.table.br_jt7@hi(, %s1)		; CHECK-NEXT: lea.sl %s1, .Lswitch.table.br_jt7@hi(, %s1)
; CHECK-NEXT: ldl.sx %s0, (%s0, %s1)		; CHECK-NEXT: ldl.sx %s0, (%s0, %s1)
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt7:		; PIC-LABEL: br_jt7:
; PIC: .LBB{{[0-9]+}}_6:		; PIC: .LBB{{[0-9]+}}_6:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: adds.w.sx %s1, -1, %s0		; PIC-NEXT: adds.w.sx %s1, -1, %s0
; PIC-NEXT: cmpu.w %s2, 8, %s1		; PIC-NEXT: cmpu.w %s2, 8, %s1
; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)		; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)
; PIC-NEXT: and %s15, %s15, (32)0		; PIC-NEXT: and %s15, %s15, (32)0
; PIC-NEXT: sic %s16		; PIC-NEXT: sic %s16
; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)		; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)
; PIC-NEXT: brgt.w 0, %s2, .LBB2_3		; PIC-NEXT: brgt.w 0, %s2, .LBB2_3
; PIC-NEXT: # %bb.1:		; PIC-NEXT: # %bb.1:
Show All 35 Lines
13: ; preds = %1, %4		13: ; preds = %1, %4
ret i32 %0		ret i32 %0
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt8(i32 signext %0) {		define signext i32 @br_jt8(i32 signext %0) {
; CHECK-LABEL: br_jt8:		; CHECK-LABEL: br_jt8:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: adds.w.sx %s1, -1, %s0		; CHECK-NEXT: adds.w.sx %s1, -1, %s0
; CHECK-NEXT: cmpu.w %s2, 8, %s1		; CHECK-NEXT: cmpu.w %s2, 8, %s1
; CHECK-NEXT: brgt.w 0, %s2, .LBB{{[0-9]+}}_3		; CHECK-NEXT: brgt.w 0, %s2, .LBB{{[0-9]+}}_3
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: and %s2, %s1, (48)0		; CHECK-NEXT: and %s2, %s1, (48)0
; CHECK-NEXT: lea %s3, 495		; CHECK-NEXT: lea %s3, 495
; CHECK-NEXT: and %s3, %s3, (32)0		; CHECK-NEXT: and %s3, %s3, (32)0
; CHECK-NEXT: srl %s2, %s3, %s2		; CHECK-NEXT: srl %s2, %s3, %s2
; CHECK-NEXT: and %s2, 1, %s2		; CHECK-NEXT: and %s2, 1, %s2
; CHECK-NEXT: brne.w 0, %s2, .LBB{{[0-9]+}}_2		; CHECK-NEXT: brne.w 0, %s2, .LBB{{[0-9]+}}_2
; CHECK-NEXT: .LBB{{[0-9]+}}_3:		; CHECK-NEXT: .LBB{{[0-9]+}}_3:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_2:		; CHECK-NEXT: .LBB{{[0-9]+}}_2:
; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1
; CHECK-NEXT: sll %s0, %s0, 2		; CHECK-NEXT: sll %s0, %s0, 2
; CHECK-NEXT: lea %s1, .Lswitch.table.br_jt8@lo		; CHECK-NEXT: lea %s1, .Lswitch.table.br_jt8@lo
; CHECK-NEXT: and %s1, %s1, (32)0		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: lea.sl %s1, .Lswitch.table.br_jt8@hi(, %s1)		; CHECK-NEXT: lea.sl %s1, .Lswitch.table.br_jt8@hi(, %s1)
; CHECK-NEXT: ldl.sx %s0, (%s0, %s1)		; CHECK-NEXT: ldl.sx %s0, (%s0, %s1)
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt8:		; PIC-LABEL: br_jt8:
; PIC: .LBB{{[0-9]+}}_6:		; PIC: .LBB{{[0-9]+}}_6:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: adds.w.sx %s1, -1, %s0		; PIC-NEXT: adds.w.sx %s1, -1, %s0
; PIC-NEXT: cmpu.w %s2, 8, %s1		; PIC-NEXT: cmpu.w %s2, 8, %s1
; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)		; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)
; PIC-NEXT: and %s15, %s15, (32)0		; PIC-NEXT: and %s15, %s15, (32)0
; PIC-NEXT: sic %s16		; PIC-NEXT: sic %s16
; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)		; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)
; PIC-NEXT: brgt.w 0, %s2, .LBB3_3		; PIC-NEXT: brgt.w 0, %s2, .LBB3_3
; PIC-NEXT: # %bb.1:		; PIC-NEXT: # %bb.1:
Show All 35 Lines
13: ; preds = %1, %4		13: ; preds = %1, %4
ret i32 %0		ret i32 %0
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt3_m(i32 signext %0, i32 signext %1) {		define signext i32 @br_jt3_m(i32 signext %0, i32 signext %1) {
; CHECK-LABEL: br_jt3_m:		; CHECK-LABEL: br_jt3_m:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: breq.w 1, %s0, .LBB{{[0-9]+}}_1		; CHECK-NEXT: breq.w 1, %s0, .LBB{{[0-9]+}}_1
; CHECK-NEXT: # %bb.2:		; CHECK-NEXT: # %bb.2:
; CHECK-NEXT: breq.w 4, %s0, .LBB{{[0-9]+}}_5		; CHECK-NEXT: breq.w 4, %s0, .LBB{{[0-9]+}}_5
; CHECK-NEXT: # %bb.3:		; CHECK-NEXT: # %bb.3:
; CHECK-NEXT: brne.w 2, %s0, .LBB{{[0-9]+}}_6		; CHECK-NEXT: brne.w 2, %s0, .LBB{{[0-9]+}}_6
; CHECK-NEXT: # %bb.4:		; CHECK-NEXT: # %bb.4:
; CHECK-NEXT: or %s0, 0, (0)1		; CHECK-NEXT: or %s0, 0, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_1:		; CHECK-NEXT: .LBB{{[0-9]+}}_1:
; CHECK-NEXT: or %s0, 3, (0)1		; CHECK-NEXT: or %s0, 3, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_5:		; CHECK-NEXT: .LBB{{[0-9]+}}_5:
; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1		; CHECK-NEXT: and %s0, %s1, (32)0
; CHECK-NEXT: adds.w.sx %s0, 3, %s0		; CHECK-NEXT: adds.w.sx %s0, 3, %s0
; CHECK-NEXT: .LBB{{[0-9]+}}_6:		; CHECK-NEXT: .LBB{{[0-9]+}}_6:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt3_m:		; PIC-LABEL: br_jt3_m:
; PIC: # %bb.0:		; PIC: # %bb.0:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: breq.w 1, %s0, .LBB4_1		; PIC-NEXT: breq.w 1, %s0, .LBB4_1
; PIC-NEXT: # %bb.2:		; PIC-NEXT: # %bb.2:
; PIC-NEXT: breq.w 4, %s0, .LBB4_5		; PIC-NEXT: breq.w 4, %s0, .LBB4_5
; PIC-NEXT: # %bb.3:		; PIC-NEXT: # %bb.3:
; PIC-NEXT: brne.w 2, %s0, .LBB4_6		; PIC-NEXT: brne.w 2, %s0, .LBB4_6
; PIC-NEXT: # %bb.4:		; PIC-NEXT: # %bb.4:
; PIC-NEXT: or %s0, 0, (0)1		; PIC-NEXT: or %s0, 0, (0)1
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
; PIC-NEXT: .LBB4_1:		; PIC-NEXT: .LBB4_1:
; PIC-NEXT: or %s0, 3, (0)1		; PIC-NEXT: or %s0, 3, (0)1
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
; PIC-NEXT: .LBB4_5:		; PIC-NEXT: .LBB4_5:
; PIC-NEXT: adds.w.sx %s0, %s1, (0)1		; PIC-NEXT: and %s0, %s1, (32)0
; PIC-NEXT: adds.w.sx %s0, 3, %s0		; PIC-NEXT: adds.w.sx %s0, 3, %s0
; PIC-NEXT: .LBB4_6:		; PIC-NEXT: .LBB4_6:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
switch i32 %0, label %6 [		switch i32 %0, label %6 [
i32 1, label %7		i32 1, label %7
i32 2, label %3		i32 2, label %3
i32 4, label %4		i32 4, label %4
Show All 13 Lines	7: ; preds = %2, %6, %4, %3
%8 = phi i32 [ %0, %6 ], [ %5, %4 ], [ 0, %3 ], [ 3, %2 ]		%8 = phi i32 [ %0, %6 ], [ %5, %4 ], [ 0, %3 ], [ 3, %2 ]
ret i32 %8		ret i32 %8
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt4_m(i32 signext %0, i32 signext %1) {		define signext i32 @br_jt4_m(i32 signext %0, i32 signext %1) {
; CHECK-LABEL: br_jt4_m:		; CHECK-LABEL: br_jt4_m:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: adds.w.sx %s2, -1, %s0		; CHECK-NEXT: adds.w.sx %s2, -1, %s0
; CHECK-NEXT: cmpu.w %s3, 3, %s2		; CHECK-NEXT: cmpu.w %s3, 3, %s2
; CHECK-NEXT: brgt.w 0, %s3, .LBB{{[0-9]+}}_5		; CHECK-NEXT: brgt.w 0, %s3, .LBB{{[0-9]+}}_5
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: adds.w.zx %s0, %s2, (0)1		; CHECK-NEXT: adds.w.zx %s0, %s2, (0)1
; CHECK-NEXT: sll %s0, %s0, 3		; CHECK-NEXT: sll %s0, %s0, 3
; CHECK-NEXT: lea %s2, .LJTI5_0@lo		; CHECK-NEXT: lea %s2, .LJTI5_0@lo
; CHECK-NEXT: and %s2, %s2, (32)0		; CHECK-NEXT: and %s2, %s2, (32)0
; CHECK-NEXT: lea.sl %s2, .LJTI5_0@hi(, %s2)		; CHECK-NEXT: lea.sl %s2, .LJTI5_0@hi(, %s2)
; CHECK-NEXT: ld %s2, (%s2, %s0)		; CHECK-NEXT: ld %s2, (%s2, %s0)
; CHECK-NEXT: or %s0, 3, (0)1		; CHECK-NEXT: or %s0, 3, (0)1
; CHECK-NEXT: b.l.t (, %s2)		; CHECK-NEXT: b.l.t (, %s2)
; CHECK-NEXT: .LBB{{[0-9]+}}_2:		; CHECK-NEXT: .LBB{{[0-9]+}}_2:
; CHECK-NEXT: or %s0, 0, (0)1		; CHECK-NEXT: or %s0, 0, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_3:		; CHECK-NEXT: .LBB{{[0-9]+}}_3:
; CHECK-NEXT: or %s0, 4, (0)1		; CHECK-NEXT: or %s0, 4, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_4:		; CHECK-NEXT: .LBB{{[0-9]+}}_4:
; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1		; CHECK-NEXT: and %s0, %s1, (32)0
; CHECK-NEXT: adds.w.sx %s0, 3, %s0		; CHECK-NEXT: adds.w.sx %s0, 3, %s0
; CHECK-NEXT: .LBB{{[0-9]+}}_5:		; CHECK-NEXT: .LBB{{[0-9]+}}_5:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt4_m:		; PIC-LABEL: br_jt4_m:
; PIC: # %bb.0:		; PIC: # %bb.0:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: brlt.w 2, %s0, .LBB5_4		; PIC-NEXT: brlt.w 2, %s0, .LBB5_4
; PIC-NEXT: # %bb.1:		; PIC-NEXT: # %bb.1:
; PIC-NEXT: breq.w 1, %s0, .LBB5_8		; PIC-NEXT: breq.w 1, %s0, .LBB5_8
; PIC-NEXT: # %bb.2:		; PIC-NEXT: # %bb.2:
; PIC-NEXT: brne.w 2, %s0, .LBB5_7		; PIC-NEXT: brne.w 2, %s0, .LBB5_7
; PIC-NEXT: # %bb.3:		; PIC-NEXT: # %bb.3:
; PIC-NEXT: or %s0, 0, (0)1		; PIC-NEXT: or %s0, 0, (0)1
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
; PIC-NEXT: .LBB5_4:		; PIC-NEXT: .LBB5_4:
; PIC-NEXT: breq.w 3, %s0, .LBB5_9		; PIC-NEXT: breq.w 3, %s0, .LBB5_9
; PIC-NEXT: # %bb.5:		; PIC-NEXT: # %bb.5:
; PIC-NEXT: brne.w 4, %s0, .LBB5_7		; PIC-NEXT: brne.w 4, %s0, .LBB5_7
; PIC-NEXT: # %bb.6:		; PIC-NEXT: # %bb.6:
; PIC-NEXT: adds.w.sx %s0, %s1, (0)1		; PIC-NEXT: and %s0, %s1, (32)0
; PIC-NEXT: adds.w.sx %s0, 3, %s0		; PIC-NEXT: adds.w.sx %s0, 3, %s0
; PIC-NEXT: .LBB5_7:		; PIC-NEXT: .LBB5_7:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
; PIC-NEXT: .LBB5_8:		; PIC-NEXT: .LBB5_8:
; PIC-NEXT: or %s0, 3, (0)1		; PIC-NEXT: or %s0, 3, (0)1
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
Show All 25 Lines	8: ; preds = %2, %7, %5, %4, %3
%9 = phi i32 [ %0, %7 ], [ %6, %5 ], [ 4, %4 ], [ 0, %3 ], [ 3, %2 ]		%9 = phi i32 [ %0, %7 ], [ %6, %5 ], [ 4, %4 ], [ 0, %3 ], [ 3, %2 ]
ret i32 %9		ret i32 %9
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt7_m(i32 signext %0, i32 signext %1) {		define signext i32 @br_jt7_m(i32 signext %0, i32 signext %1) {
; CHECK-LABEL: br_jt7_m:		; CHECK-LABEL: br_jt7_m:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s2, %s0, (0)1		; CHECK-NEXT: and %s2, %s0, (32)0
; CHECK-NEXT: adds.w.sx %s0, -1, %s2		; CHECK-NEXT: adds.w.sx %s0, -1, %s2
; CHECK-NEXT: cmpu.w %s3, 8, %s0		; CHECK-NEXT: cmpu.w %s3, 8, %s0
; CHECK-NEXT: brgt.w 0, %s3, .LBB{{[0-9]+}}_8		; CHECK-NEXT: brgt.w 0, %s3, .LBB{{[0-9]+}}_8
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: adds.w.zx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.zx %s0, %s0, (0)1
; CHECK-NEXT: sll %s0, %s0, 3		; CHECK-NEXT: sll %s0, %s0, 3
; CHECK-NEXT: lea %s3, .LJTI6_0@lo		; CHECK-NEXT: lea %s3, .LJTI6_0@lo
; CHECK-NEXT: and %s3, %s3, (32)0		; CHECK-NEXT: and %s3, %s3, (32)0
; CHECK-NEXT: lea.sl %s3, .LJTI6_0@hi(, %s3)		; CHECK-NEXT: lea.sl %s3, .LJTI6_0@hi(, %s3)
; CHECK-NEXT: ld %s3, (%s3, %s0)		; CHECK-NEXT: ld %s3, (%s3, %s0)
; CHECK-NEXT: adds.w.sx %s1, %s1, (0)1		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: or %s0, 3, (0)1		; CHECK-NEXT: or %s0, 3, (0)1
; CHECK-NEXT: b.l.t (, %s3)		; CHECK-NEXT: b.l.t (, %s3)
; CHECK-NEXT: .LBB{{[0-9]+}}_2:		; CHECK-NEXT: .LBB{{[0-9]+}}_2:
; CHECK-NEXT: or %s0, 0, (0)1		; CHECK-NEXT: or %s0, 0, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_3:		; CHECK-NEXT: .LBB{{[0-9]+}}_3:
; CHECK-NEXT: or %s0, 4, (0)1		; CHECK-NEXT: or %s0, 4, (0)1
Show All 18 Lines
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_5:		; CHECK-NEXT: .LBB{{[0-9]+}}_5:
; CHECK-NEXT: adds.w.sx %s0, -2, %s1		; CHECK-NEXT: adds.w.sx %s0, -2, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt7_m:		; PIC-LABEL: br_jt7_m:
; PIC: # %bb.0:		; PIC: # %bb.0:
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: and %s0, %s0, (32)0
; PIC-NEXT: brge.w 3, %s0, .LBB6_1		; PIC-NEXT: brge.w 3, %s0, .LBB6_1
; PIC-NEXT: # %bb.6:		; PIC-NEXT: # %bb.6:
; PIC-NEXT: brlt.w 7, %s0, .LBB6_10		; PIC-NEXT: brlt.w 7, %s0, .LBB6_10
; PIC-NEXT: # %bb.7:		; PIC-NEXT: # %bb.7:
; PIC-NEXT: adds.w.sx %s1, %s1, (0)1		; PIC-NEXT: and %s1, %s1, (32)0
; PIC-NEXT: breq.w 4, %s0, .LBB6_14		; PIC-NEXT: breq.w 4, %s0, .LBB6_14
; PIC-NEXT: # %bb.8:		; PIC-NEXT: # %bb.8:
; PIC-NEXT: brne.w 7, %s0, .LBB6_16		; PIC-NEXT: brne.w 7, %s0, .LBB6_16
; PIC-NEXT: # %bb.9:		; PIC-NEXT: # %bb.9:
; PIC-NEXT: adds.w.sx %s0, -2, %s1		; PIC-NEXT: adds.w.sx %s0, -2, %s1
; PIC-NEXT: adds.w.sx %s0, %s0, (0)1		; PIC-NEXT: adds.w.sx %s0, %s0, (0)1
; PIC-NEXT: b.l.t (, %s10)		; PIC-NEXT: b.l.t (, %s10)
; PIC-NEXT: .LBB6_1:		; PIC-NEXT: .LBB6_1:
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	12: ; preds = %2, %11, %10, %9, %7, %5, %4, %3
%13 = phi i32 [ %0, %11 ], [ 11, %10 ], [ 10, %9 ], [ %8, %7 ], [ %6, %5 ], [ 4, %4 ], [ 0, %3 ], [ 3, %2 ]		%13 = phi i32 [ %0, %11 ], [ 11, %10 ], [ 10, %9 ], [ %8, %7 ], [ %6, %5 ], [ 4, %4 ], [ 0, %3 ], [ 3, %2 ]
ret i32 %13		ret i32 %13
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define signext i32 @br_jt8_m(i32 signext %0, i32 signext %1) {		define signext i32 @br_jt8_m(i32 signext %0, i32 signext %1) {
; CHECK-LABEL: br_jt8_m:		; CHECK-LABEL: br_jt8_m:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s2, %s0, (0)1		; CHECK-NEXT: and %s2, %s0, (32)0
; CHECK-NEXT: adds.w.sx %s0, -1, %s2		; CHECK-NEXT: adds.w.sx %s0, -1, %s2
; CHECK-NEXT: cmpu.w %s3, 8, %s0		; CHECK-NEXT: cmpu.w %s3, 8, %s0
; CHECK-NEXT: brgt.w 0, %s3, .LBB{{[0-9]+}}_9		; CHECK-NEXT: brgt.w 0, %s3, .LBB{{[0-9]+}}_9
; CHECK-NEXT: # %bb.1:		; CHECK-NEXT: # %bb.1:
; CHECK-NEXT: adds.w.zx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.zx %s0, %s0, (0)1
; CHECK-NEXT: sll %s0, %s0, 3		; CHECK-NEXT: sll %s0, %s0, 3
; CHECK-NEXT: lea %s3, .LJTI7_0@lo		; CHECK-NEXT: lea %s3, .LJTI7_0@lo
; CHECK-NEXT: and %s3, %s3, (32)0		; CHECK-NEXT: and %s3, %s3, (32)0
; CHECK-NEXT: lea.sl %s3, .LJTI7_0@hi(, %s3)		; CHECK-NEXT: lea.sl %s3, .LJTI7_0@hi(, %s3)
; CHECK-NEXT: ld %s3, (%s3, %s0)		; CHECK-NEXT: ld %s3, (%s3, %s0)
; CHECK-NEXT: adds.w.sx %s1, %s1, (0)1		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: or %s0, 3, (0)1		; CHECK-NEXT: or %s0, 3, (0)1
; CHECK-NEXT: b.l.t (, %s3)		; CHECK-NEXT: b.l.t (, %s3)
; CHECK-NEXT: .LBB{{[0-9]+}}_2:		; CHECK-NEXT: .LBB{{[0-9]+}}_2:
; CHECK-NEXT: or %s0, 0, (0)1		; CHECK-NEXT: or %s0, 0, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_3:		; CHECK-NEXT: .LBB{{[0-9]+}}_3:
; CHECK-NEXT: or %s0, 4, (0)1		; CHECK-NEXT: or %s0, 4, (0)1
Show All 22 Lines
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
; CHECK-NEXT: .LBB{{[0-9]+}}_7:		; CHECK-NEXT: .LBB{{[0-9]+}}_7:
; CHECK-NEXT: or %s0, 10, (0)1		; CHECK-NEXT: or %s0, 10, (0)1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
;		;
; PIC-LABEL: br_jt8_m:		; PIC-LABEL: br_jt8_m:
; PIC: .LBB{{[0-9]+}}_12:		; PIC: .LBB{{[0-9]+}}_12:
; PIC-NEXT: adds.w.sx %s2, %s0, (0)1		; PIC-NEXT: and %s2, %s0, (32)0
; PIC-NEXT: adds.w.sx %s0, -1, %s2		; PIC-NEXT: adds.w.sx %s0, -1, %s2
; PIC-NEXT: cmpu.w %s3, 8, %s0		; PIC-NEXT: cmpu.w %s3, 8, %s0
; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)		; PIC-NEXT: lea %s15, _GLOBAL_OFFSET_TABLE_@pc_lo(-24)
; PIC-NEXT: and %s15, %s15, (32)0		; PIC-NEXT: and %s15, %s15, (32)0
; PIC-NEXT: sic %s16		; PIC-NEXT: sic %s16
; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)		; PIC-NEXT: lea.sl %s15, _GLOBAL_OFFSET_TABLE_@pc_hi(%s16, %s15)
; PIC-NEXT: brgt.w 0, %s3, .LBB7_9		; PIC-NEXT: brgt.w 0, %s3, .LBB7_9
; PIC-NEXT: # %bb.1:		; PIC-NEXT: # %bb.1:
; PIC-NEXT: adds.w.sx %s1, %s1, (0)1		; PIC-NEXT: and %s1, %s1, (32)0
; PIC-NEXT: adds.w.zx %s0, %s0, (0)1		; PIC-NEXT: adds.w.zx %s0, %s0, (0)1
; PIC-NEXT: sll %s0, %s0, 2		; PIC-NEXT: sll %s0, %s0, 2
; PIC-NEXT: lea %s3, .LJTI7_0@gotoff_lo		; PIC-NEXT: lea %s3, .LJTI7_0@gotoff_lo
; PIC-NEXT: and %s3, %s3, (32)0		; PIC-NEXT: and %s3, %s3, (32)0
; PIC-NEXT: lea.sl %s3, .LJTI7_0@gotoff_hi(%s3, %s15)		; PIC-NEXT: lea.sl %s3, .LJTI7_0@gotoff_hi(%s3, %s15)
; PIC-NEXT: ldl.sx %s0, (%s3, %s0)		; PIC-NEXT: ldl.sx %s0, (%s3, %s0)
; PIC-NEXT: lea %s3, br_jt8_m@gotoff_lo		; PIC-NEXT: lea %s3, br_jt8_m@gotoff_lo
; PIC-NEXT: and %s3, %s3, (32)0		; PIC-NEXT: and %s3, %s3, (32)0
▲ Show 20 Lines • Show All 72 Lines • Show Last 20 Lines

llvm/test/CodeGen/VE/Scalar/select.ll

Show First 20 Lines • Show All 113 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
%4 = select i1 %0, i32 %1, i32 %2		%4 = select i1 %0, i32 %1, i32 %2
ret i32 %4		ret i32 %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_i64_var(i1 zeroext %0, i64 %1, i64 %2) {		define i64 @select_i64_var(i1 zeroext %0, i64 %1, i64 %2) {
; CHECK-LABEL: select_i64_var:		; CHECK-LABEL: select_i64_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select i1 %0, i64 %1, i64 %2		%4 = select i1 %0, i64 %1, i64 %2
ret i64 %4		ret i64 %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_u64_var(i1 zeroext %0, i64 %1, i64 %2) {		define i64 @select_u64_var(i1 zeroext %0, i64 %1, i64 %2) {
; CHECK-LABEL: select_u64_var:		; CHECK-LABEL: select_u64_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select i1 %0, i64 %1, i64 %2		%4 = select i1 %0, i64 %1, i64 %2
ret i64 %4		ret i64 %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_i128_var(i1 zeroext %0, i128 %1, i128 %2) {		define i128 @select_i128_var(i1 zeroext %0, i128 %1, i128 %2) {
; CHECK-LABEL: select_i128_var:		; CHECK-LABEL: select_i128_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s3, %s1, %s0		; CHECK-NEXT: cmov.w.ne %s3, %s1, %s0
; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0		; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0
; CHECK-NEXT: or %s0, 0, %s3		; CHECK-NEXT: or %s0, 0, %s3
; CHECK-NEXT: or %s1, 0, %s4		; CHECK-NEXT: or %s1, 0, %s4
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select i1 %0, i128 %1, i128 %2		%4 = select i1 %0, i128 %1, i128 %2
ret i128 %4		ret i128 %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_u128_var(i1 zeroext %0, i128 %1, i128 %2) {		define i128 @select_u128_var(i1 zeroext %0, i128 %1, i128 %2) {
; CHECK-LABEL: select_u128_var:		; CHECK-LABEL: select_u128_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s3, %s1, %s0		; CHECK-NEXT: cmov.w.ne %s3, %s1, %s0
; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0		; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0
; CHECK-NEXT: or %s0, 0, %s3		; CHECK-NEXT: or %s0, 0, %s3
; CHECK-NEXT: or %s1, 0, %s4		; CHECK-NEXT: or %s1, 0, %s4
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select i1 %0, i128 %1, i128 %2		%4 = select i1 %0, i128 %1, i128 %2
ret i128 %4		ret i128 %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define float @select_float_var(i1 zeroext %0, float %1, float %2) {		define float @select_float_var(i1 zeroext %0, float %1, float %2) {
; CHECK-LABEL: select_float_var:		; CHECK-LABEL: select_float_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select fast i1 %0, float %1, float %2		%4 = select fast i1 %0, float %1, float %2
ret float %4		ret float %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define double @select_double_var(i1 zeroext %0, double %1, double %2) {		define double @select_double_var(i1 zeroext %0, double %1, double %2) {
; CHECK-LABEL: select_double_var:		; CHECK-LABEL: select_double_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s1, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select fast i1 %0, double %1, double %2		%4 = select fast i1 %0, double %1, double %2
ret double %4		ret double %4
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define fp128 @select_quad_var(i1 zeroext %0, fp128 %1, fp128 %2) {		define fp128 @select_quad_var(i1 zeroext %0, fp128 %1, fp128 %2) {
; CHECK-LABEL: select_quad_var:		; CHECK-LABEL: select_quad_var:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0		; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0
; CHECK-NEXT: cmov.w.ne %s5, %s3, %s0		; CHECK-NEXT: cmov.w.ne %s5, %s3, %s0
; CHECK-NEXT: or %s0, 0, %s4		; CHECK-NEXT: or %s0, 0, %s4
; CHECK-NEXT: or %s1, 0, %s5		; CHECK-NEXT: or %s1, 0, %s5
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%4 = select fast i1 %0, fp128 %1, fp128 %2		%4 = select fast i1 %0, fp128 %1, fp128 %2
ret fp128 %4		ret fp128 %4
}		}
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i32 65535, i32 %1		%3 = select i1 %0, i32 65535, i32 %1
ret i32 %3		ret i32 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_i64_mimm(i1 zeroext %0, i64 %1) {		define i64 @select_i64_mimm(i1 zeroext %0, i64 %1) {
; CHECK-LABEL: select_i64_mimm:		; CHECK-LABEL: select_i64_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i64 65535, i64 %1		%3 = select i1 %0, i64 65535, i64 %1
ret i64 %3		ret i64 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_u64_mimm(i1 zeroext %0, i64 %1) {		define i64 @select_u64_mimm(i1 zeroext %0, i64 %1) {
; CHECK-LABEL: select_u64_mimm:		; CHECK-LABEL: select_u64_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i64 65535, i64 %1		%3 = select i1 %0, i64 65535, i64 %1
ret i64 %3		ret i64 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_i128_mimm(i1 zeroext %0, i128 %1) {		define i128 @select_i128_mimm(i1 zeroext %0, i128 %1) {
; CHECK-LABEL: select_i128_mimm:		; CHECK-LABEL: select_i128_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0
; CHECK-NEXT: cmov.w.ne %s2, (0)1, %s0		; CHECK-NEXT: cmov.w.ne %s2, (0)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: or %s1, 0, %s2		; CHECK-NEXT: or %s1, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i128 65535, i128 %1		%3 = select i1 %0, i128 65535, i128 %1
ret i128 %3		ret i128 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_u128_mimm(i1 zeroext %0, i128 %1) {		define i128 @select_u128_mimm(i1 zeroext %0, i128 %1) {
; CHECK-LABEL: select_u128_mimm:		; CHECK-LABEL: select_u128_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.ne %s1, (48)0, %s0
; CHECK-NEXT: cmov.w.ne %s2, (0)1, %s0		; CHECK-NEXT: cmov.w.ne %s2, (0)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: or %s1, 0, %s2		; CHECK-NEXT: or %s1, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i128 65535, i128 %1		%3 = select i1 %0, i128 65535, i128 %1
ret i128 %3		ret i128 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define float @select_float_mimm(i1 zeroext %0, float %1) {		define float @select_float_mimm(i1 zeroext %0, float %1) {
; CHECK-LABEL: select_float_mimm:		; CHECK-LABEL: select_float_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s1, (2)1, %s0		; CHECK-NEXT: cmov.w.ne %s1, (2)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, float -2.000000e+00, float %1		%3 = select i1 %0, float -2.000000e+00, float %1
ret float %3		ret float %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define double @select_double_mimm(i1 zeroext %0, double %1) {		define double @select_double_mimm(i1 zeroext %0, double %1) {
; CHECK-LABEL: select_double_mimm:		; CHECK-LABEL: select_double_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s1, (2)1, %s0		; CHECK-NEXT: cmov.w.ne %s1, (2)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select fast i1 %0, double -2.000000e+00, double %1		%3 = select fast i1 %0, double -2.000000e+00, double %1
ret double %3		ret double %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define fp128 @select_quad_mimm(i1 zeroext %0, fp128 %1) {		define fp128 @select_quad_mimm(i1 zeroext %0, fp128 %1) {
; CHECK-LABEL: select_quad_mimm:		; CHECK-LABEL: select_quad_mimm:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lea %s1, .LCPI{{[0-9]+}}_0@lo		; CHECK-NEXT: lea %s1, .LCPI{{[0-9]+}}_0@lo
; CHECK-NEXT: and %s1, %s1, (32)0		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: lea.sl %s1, .LCPI{{[0-9]+}}_0@hi(, %s1)		; CHECK-NEXT: lea.sl %s1, .LCPI{{[0-9]+}}_0@hi(, %s1)
; CHECK-NEXT: ld %s4, 8(, %s1)		; CHECK-NEXT: ld %s4, 8(, %s1)
; CHECK-NEXT: ld %s5, (, %s1)		; CHECK-NEXT: ld %s5, (, %s1)
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0
; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0		; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: or %s1, 0, %s3		; CHECK-NEXT: or %s1, 0, %s3
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select fast i1 %0, fp128 0xL0000000000000000C000000000000000, fp128 %1		%3 = select fast i1 %0, fp128 0xL0000000000000000C000000000000000, fp128 %1
ret fp128 %3		ret fp128 %3
}		}
▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i32 %1, i32 65535		%3 = select i1 %0, i32 %1, i32 65535
ret i32 %3		ret i32 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_mimm_i64(i1 zeroext %0, i64 %1) {		define i64 @select_mimm_i64(i1 zeroext %0, i64 %1) {
; CHECK-LABEL: select_mimm_i64:		; CHECK-LABEL: select_mimm_i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i64 %1, i64 65535		%3 = select i1 %0, i64 %1, i64 65535
ret i64 %3		ret i64 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_mimm_u64(i1 zeroext %0, i64 %1) {		define i64 @select_mimm_u64(i1 zeroext %0, i64 %1) {
; CHECK-LABEL: select_mimm_u64:		; CHECK-LABEL: select_mimm_u64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i64 %1, i64 65535		%3 = select i1 %0, i64 %1, i64 65535
ret i64 %3		ret i64 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_mimm_i128(i1 zeroext %0, i128 %1) {		define i128 @select_mimm_i128(i1 zeroext %0, i128 %1) {
; CHECK-LABEL: select_mimm_i128:		; CHECK-LABEL: select_mimm_i128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0
; CHECK-NEXT: cmov.w.eq %s2, (0)1, %s0		; CHECK-NEXT: cmov.w.eq %s2, (0)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: or %s1, 0, %s2		; CHECK-NEXT: or %s1, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i128 %1, i128 65535		%3 = select i1 %0, i128 %1, i128 65535
ret i128 %3		ret i128 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_mimm_u128(i1 zeroext %0, i128 %1) {		define i128 @select_mimm_u128(i1 zeroext %0, i128 %1) {
; CHECK-LABEL: select_mimm_u128:		; CHECK-LABEL: select_mimm_u128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0		; CHECK-NEXT: cmov.w.eq %s1, (48)0, %s0
; CHECK-NEXT: cmov.w.eq %s2, (0)1, %s0		; CHECK-NEXT: cmov.w.eq %s2, (0)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: or %s1, 0, %s2		; CHECK-NEXT: or %s1, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, i128 %1, i128 65535		%3 = select i1 %0, i128 %1, i128 65535
ret i128 %3		ret i128 %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define float @select_mimm_float(i1 zeroext %0, float %1) {		define float @select_mimm_float(i1 zeroext %0, float %1) {
; CHECK-LABEL: select_mimm_float:		; CHECK-LABEL: select_mimm_float:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.eq %s1, (2)1, %s0		; CHECK-NEXT: cmov.w.eq %s1, (2)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select i1 %0, float %1, float -2.000000e+00		%3 = select i1 %0, float %1, float -2.000000e+00
ret float %3		ret float %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define double @select_mimm_double(i1 zeroext %0, double %1) {		define double @select_mimm_double(i1 zeroext %0, double %1) {
; CHECK-LABEL: select_mimm_double:		; CHECK-LABEL: select_mimm_double:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.eq %s1, (2)1, %s0		; CHECK-NEXT: cmov.w.eq %s1, (2)1, %s0
; CHECK-NEXT: or %s0, 0, %s1		; CHECK-NEXT: or %s0, 0, %s1
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select fast i1 %0, double %1, double -2.000000e+00		%3 = select fast i1 %0, double %1, double -2.000000e+00
ret double %3		ret double %3
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define fp128 @select_mimm_quad(i1 zeroext %0, fp128 %1) {		define fp128 @select_mimm_quad(i1 zeroext %0, fp128 %1) {
; CHECK-LABEL: select_mimm_quad:		; CHECK-LABEL: select_mimm_quad:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: lea %s1, .LCPI{{[0-9]+}}_0@lo		; CHECK-NEXT: lea %s1, .LCPI{{[0-9]+}}_0@lo
; CHECK-NEXT: and %s1, %s1, (32)0		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: lea.sl %s1, .LCPI{{[0-9]+}}_0@hi(, %s1)		; CHECK-NEXT: lea.sl %s1, .LCPI{{[0-9]+}}_0@hi(, %s1)
; CHECK-NEXT: ld %s4, 8(, %s1)		; CHECK-NEXT: ld %s4, 8(, %s1)
; CHECK-NEXT: ld %s5, (, %s1)		; CHECK-NEXT: ld %s5, (, %s1)
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0		; CHECK-NEXT: cmov.w.ne %s4, %s2, %s0
; CHECK-NEXT: cmov.w.ne %s5, %s3, %s0		; CHECK-NEXT: cmov.w.ne %s5, %s3, %s0
; CHECK-NEXT: or %s0, 0, %s4		; CHECK-NEXT: or %s0, 0, %s4
; CHECK-NEXT: or %s1, 0, %s5		; CHECK-NEXT: or %s1, 0, %s5
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%3 = select fast i1 %0, fp128 %1, fp128 0xL0000000000000000C000000000000000		%3 = select fast i1 %0, fp128 %1, fp128 0xL0000000000000000C000000000000000
ret fp128 %3		ret fp128 %3
}		}

llvm/test/CodeGen/VE/Scalar/select_cc.ll

Show First 20 Lines • Show All 1,320 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret i32 %6		ret i32 %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_cc_i1_i64(i1 zeroext %0, i1 zeroext %1, i64 %2, i64 %3) {		define i64 @select_cc_i1_i64(i1 zeroext %0, i1 zeroext %1, i64 %2, i64 %3) {
; CHECK-LABEL: select_cc_i1_i64:		; CHECK-LABEL: select_cc_i1_i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select i1 %5, i64 %3, i64 %2		%6 = select i1 %5, i64 %3, i64 %2
ret i64 %6		ret i64 %6
}		}

▲ Show 20 Lines • Show All 172 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret i64 %6		ret i64 %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i64 @select_cc_i1_u64(i1 zeroext %0, i1 zeroext %1, i64 %2, i64 %3) {		define i64 @select_cc_i1_u64(i1 zeroext %0, i1 zeroext %1, i64 %2, i64 %3) {
; CHECK-LABEL: select_cc_i1_u64:		; CHECK-LABEL: select_cc_i1_u64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select i1 %5, i64 %3, i64 %2		%6 = select i1 %5, i64 %3, i64 %2
ret i64 %6		ret i64 %6
}		}

▲ Show 20 Lines • Show All 172 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret i64 %6		ret i64 %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_cc_i1_i128(i1 zeroext %0, i1 zeroext %1, i128 %2, i128 %3) {		define i128 @select_cc_i1_i128(i1 zeroext %0, i1 zeroext %1, i128 %2, i128 %3) {
; CHECK-LABEL: select_cc_i1_i128:		; CHECK-LABEL: select_cc_i1_i128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0
; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0		; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: or %s1, 0, %s3		; CHECK-NEXT: or %s1, 0, %s3
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select i1 %5, i128 %3, i128 %2		%6 = select i1 %5, i128 %3, i128 %2
ret i128 %6		ret i128 %6
▲ Show 20 Lines • Show All 200 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret i128 %6		ret i128 %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define i128 @select_cc_i1_u128(i1 zeroext %0, i1 zeroext %1, i128 %2, i128 %3) {		define i128 @select_cc_i1_u128(i1 zeroext %0, i1 zeroext %1, i128 %2, i128 %3) {
; CHECK-LABEL: select_cc_i1_u128:		; CHECK-LABEL: select_cc_i1_u128:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0
; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0		; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: or %s1, 0, %s3		; CHECK-NEXT: or %s1, 0, %s3
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select i1 %5, i128 %3, i128 %2		%6 = select i1 %5, i128 %3, i128 %2
ret i128 %6		ret i128 %6
▲ Show 20 Lines • Show All 200 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret i128 %6		ret i128 %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define float @select_cc_i1_float(i1 zeroext %0, i1 zeroext %1, float %2, float %3) {		define float @select_cc_i1_float(i1 zeroext %0, i1 zeroext %1, float %2, float %3) {
; CHECK-LABEL: select_cc_i1_float:		; CHECK-LABEL: select_cc_i1_float:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select fast i1 %5, float %3, float %2		%6 = select fast i1 %5, float %3, float %2
ret float %6		ret float %6
}		}

▲ Show 20 Lines • Show All 172 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret float %6		ret float %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define double @select_cc_i1_double(i1 zeroext %0, i1 zeroext %1, double %2, double %3) {		define double @select_cc_i1_double(i1 zeroext %0, i1 zeroext %1, double %2, double %3) {
; CHECK-LABEL: select_cc_i1_double:		; CHECK-LABEL: select_cc_i1_double:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s3, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select fast i1 %5, double %3, double %2		%6 = select fast i1 %5, double %3, double %2
ret double %6		ret double %6
}		}

▲ Show 20 Lines • Show All 172 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
ret double %6		ret double %6
}		}

; Function Attrs: norecurse nounwind readnone		; Function Attrs: norecurse nounwind readnone
define fp128 @select_cc_i1_quad(i1 zeroext %0, i1 zeroext %1, fp128 %2, fp128 %3) {		define fp128 @select_cc_i1_quad(i1 zeroext %0, i1 zeroext %1, fp128 %2, fp128 %3) {
; CHECK-LABEL: select_cc_i1_quad:		; CHECK-LABEL: select_cc_i1_quad:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: xor %s0, %s0, %s1		; CHECK-NEXT: xor %s0, %s0, %s1
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0		; CHECK-NEXT: cmov.w.ne %s2, %s4, %s0
; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0		; CHECK-NEXT: cmov.w.ne %s3, %s5, %s0
; CHECK-NEXT: or %s0, 0, %s2		; CHECK-NEXT: or %s0, 0, %s2
; CHECK-NEXT: or %s1, 0, %s3		; CHECK-NEXT: or %s1, 0, %s3
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%5 = xor i1 %0, %1		%5 = xor i1 %0, %1
%6 = select fast i1 %5, fp128 %3, fp128 %2		%6 = select fast i1 %5, fp128 %3, fp128 %2
ret fp128 %6		ret fp128 %6
▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/test/CodeGen/VE/VELIntrinsics/lsv.ll

	; RUN: llc < %s -mtriple=ve -mattr=+vpu \| FileCheck %s			; RUN: llc < %s -mtriple=ve -mattr=+vpu \| FileCheck %s

	;;; Test prefetch vector intrinsic instructions			;;; Test prefetch vector intrinsic instructions
	;;;			;;;
	;;; Note:			;;; Note:
	;;; We test LSVrr_v and LVSvr instructions.			;;; We test LSVrr_v and LVSvr instructions.

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @lsv_vvss(i8* %0, i64 %1, i32 signext %2) {			define void @lsv_vvss(i8* %0, i64 %1, i32 signext %2) {
	; CHECK-LABEL: lsv_vvss:			; CHECK-LABEL: lsv_vvss:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s3, 256			; CHECK-NEXT: lea %s3, 256
	; CHECK-NEXT: lvl %s3			; CHECK-NEXT: lvl %s3
	; CHECK-NEXT: vld %v0, 8, %s0			; CHECK-NEXT: vld %v0, 8, %s0
	; CHECK-NEXT: adds.w.sx %s2, %s2, (0)1			; CHECK-NEXT: and %s2, %s2, (32)0
	; CHECK-NEXT: lsv %v0(%s2), %s1			; CHECK-NEXT: lsv %v0(%s2), %s1
	; CHECK-NEXT: vst %v0, 8, %s0			; CHECK-NEXT: vst %v0, 8, %s0
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%4 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)			%4 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)
	%5 = tail call fast <256 x double> @llvm.ve.vl.lsv.vvss(<256 x double> %4, i32 %2, i64 %1)			%5 = tail call fast <256 x double> @llvm.ve.vl.lsv.vvss(<256 x double> %4, i32 %2, i64 %1)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %5, i64 8, i8* %0, i32 256)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %5, i64 8, i8* %0, i32 256)
	ret void			ret void
	}			}
	Show All 9 Lines

	; Function Attrs: nounwind readonly			; Function Attrs: nounwind readonly
	define i64 @lvsl_vssl_imm(i8* readonly %0, i32 signext %1) {			define i64 @lvsl_vssl_imm(i8* readonly %0, i32 signext %1) {
	; CHECK-LABEL: lvsl_vssl_imm:			; CHECK-LABEL: lvsl_vssl_imm:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s2, 256			; CHECK-NEXT: lea %s2, 256
	; CHECK-NEXT: lvl %s2			; CHECK-NEXT: lvl %s2
	; CHECK-NEXT: vld %v0, 8, %s0			; CHECK-NEXT: vld %v0, 8, %s0
	; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1			; CHECK-NEXT: and %s0, %s1, (32)0
	; CHECK-NEXT: lvs %s0, %v0(%s0)			; CHECK-NEXT: lvs %s0, %v0(%s0)
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)			%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)
	%4 = tail call i64 @llvm.ve.vl.lvsl.svs(<256 x double> %3, i32 %1)			%4 = tail call i64 @llvm.ve.vl.lvsl.svs(<256 x double> %3, i32 %1)
	ret i64 %4			ret i64 %4
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare i64 @llvm.ve.vl.lvsl.svs(<256 x double>, i32)			declare i64 @llvm.ve.vl.lvsl.svs(<256 x double>, i32)

	; Function Attrs: nounwind readonly			; Function Attrs: nounwind readonly
	define double @lvsd_vssl_imm(i8* readonly %0, i32 signext %1) {			define double @lvsd_vssl_imm(i8* readonly %0, i32 signext %1) {
	; CHECK-LABEL: lvsd_vssl_imm:			; CHECK-LABEL: lvsd_vssl_imm:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s2, 256			; CHECK-NEXT: lea %s2, 256
	; CHECK-NEXT: lvl %s2			; CHECK-NEXT: lvl %s2
	; CHECK-NEXT: vld %v0, 8, %s0			; CHECK-NEXT: vld %v0, 8, %s0
	; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1			; CHECK-NEXT: and %s0, %s1, (32)0
	; CHECK-NEXT: lvs %s0, %v0(%s0)			; CHECK-NEXT: lvs %s0, %v0(%s0)
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)			%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)
	%4 = tail call fast double @llvm.ve.vl.lvsd.svs(<256 x double> %3, i32 %1)			%4 = tail call fast double @llvm.ve.vl.lvsd.svs(<256 x double> %3, i32 %1)
	ret double %4			ret double %4
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare double @llvm.ve.vl.lvsd.svs(<256 x double>, i32)			declare double @llvm.ve.vl.lvsd.svs(<256 x double>, i32)

	; Function Attrs: nounwind readonly			; Function Attrs: nounwind readonly
	define float @lvss_vssl_imm(i8* readonly %0, i32 signext %1) {			define float @lvss_vssl_imm(i8* readonly %0, i32 signext %1) {
	; CHECK-LABEL: lvss_vssl_imm:			; CHECK-LABEL: lvss_vssl_imm:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s2, 256			; CHECK-NEXT: lea %s2, 256
	; CHECK-NEXT: lvl %s2			; CHECK-NEXT: lvl %s2
	; CHECK-NEXT: vld %v0, 8, %s0			; CHECK-NEXT: vld %v0, 8, %s0
	; CHECK-NEXT: adds.w.sx %s0, %s1, (0)1			; CHECK-NEXT: and %s0, %s1, (32)0
	; CHECK-NEXT: lvs %s0, %v0(%s0)			; CHECK-NEXT: lvs %s0, %v0(%s0)
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)			%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %0, i32 256)
	%4 = tail call fast float @llvm.ve.vl.lvss.svs(<256 x double> %3, i32 %1)			%4 = tail call fast float @llvm.ve.vl.lvss.svs(<256 x double> %3, i32 %1)
	ret float %4			ret float %4
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare float @llvm.ve.vl.lvss.svs(<256 x double>, i32)			declare float @llvm.ve.vl.lvss.svs(<256 x double>, i32)

llvm/test/CodeGen/VE/VELIntrinsics/lvlgen.ll

	Show All 10 Lines

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @switching_vl(i32 %evl, i32 %evl2, i8* %P, i8* %Q) {			define void @switching_vl(i32 %evl, i32 %evl2, i8* %P, i8* %Q) {
	; CHECK-LABEL: switching_vl:			; CHECK-LABEL: switching_vl:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s4, 256			; CHECK-NEXT: lea %s4, 256
	; CHECK-NEXT: lvl %s4			; CHECK-NEXT: lvl %s4
	; CHECK-NEXT: vld %v0, 8, %s2			; CHECK-NEXT: vld %v0, 8, %s2
	; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1			; CHECK-NEXT: and %s0, %s0, (32)0
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vst %v0, 16, %s3			; CHECK-NEXT: vst %v0, 16, %s3
	; CHECK-NEXT: lea %s4, 128			; CHECK-NEXT: lea %s4, 128
	; CHECK-NEXT: lvl %s4			; CHECK-NEXT: lvl %s4
	; CHECK-NEXT: vld %v0, 16, %s2			; CHECK-NEXT: vld %v0, 16, %s2
	; CHECK-NEXT: adds.w.sx %s1, %s1, (0)1			; CHECK-NEXT: and %s1, %s1, (32)0
	; CHECK-NEXT: lvl %s1			; CHECK-NEXT: lvl %s1
	; CHECK-NEXT: vst %v0, 16, %s3			; CHECK-NEXT: vst %v0, 16, %s3
	; CHECK-NEXT: lvl %s4			; CHECK-NEXT: lvl %s4
	; CHECK-NEXT: vld %v0, 8, %s2			; CHECK-NEXT: vld %v0, 8, %s2
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vst %v0, 16, %s3			; CHECK-NEXT: vst %v0, 16, %s3
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%l0 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 256)			%l0 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 256)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l0, i64 16, i8* %Q, i32 %evl)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l0, i64 16, i8* %Q, i32 %evl)
	%l1 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 16, i8* %P, i32 128)			%l1 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 16, i8* %P, i32 128)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l1, i64 16, i8* %Q, i32 %evl2)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l1, i64 16, i8* %Q, i32 %evl2)
	%l2 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 128)			%l2 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 128)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l2, i64 16, i8* %Q, i32 %evl)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l2, i64 16, i8* %Q, i32 %evl)
	ret void			ret void
	}			}

	; Check that no redundant 'lvl' is inserted when vector length does not change			; Check that no redundant 'lvl' is inserted when vector length does not change
	; in a basic block.			; in a basic block.


	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @stable_vl(i32 %evl, i8* %P, i8* %Q) {			define void @stable_vl(i32 %evl, i8* %P, i8* %Q) {
	; CHECK-LABEL: stable_vl:			; CHECK-LABEL: stable_vl:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1			; CHECK-NEXT: and %s0, %s0, (32)0
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vld %v0, 8, %s1			; CHECK-NEXT: vld %v0, 8, %s1
	; CHECK-NEXT: vst %v0, 16, %s2			; CHECK-NEXT: vst %v0, 16, %s2
	; CHECK-NEXT: vld %v0, 16, %s1			; CHECK-NEXT: vld %v0, 16, %s1
	; CHECK-NEXT: vst %v0, 16, %s2			; CHECK-NEXT: vst %v0, 16, %s2
	; CHECK-NEXT: vld %v0, 8, %s1			; CHECK-NEXT: vld %v0, 8, %s1
	; CHECK-NEXT: vst %v0, 16, %s2			; CHECK-NEXT: vst %v0, 16, %s2
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%l0 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 %evl)			%l0 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 %evl)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l0, i64 16, i8* %Q, i32 %evl)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l0, i64 16, i8* %Q, i32 %evl)
	%l1 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 16, i8* %P, i32 %evl)			%l1 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 16, i8* %P, i32 %evl)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l1, i64 16, i8* %Q, i32 %evl)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l1, i64 16, i8* %Q, i32 %evl)
	%l2 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 %evl)			%l2 = tail call <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %P, i32 %evl)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l2, i64 16, i8* %Q, i32 %evl)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %l2, i64 16, i8* %Q, i32 %evl)
	ret void			ret void
	}			}

llvm/test/CodeGen/VE/VELIntrinsics/vbrd.ll

	Show First 20 Lines • Show All 257 Lines • ▼ Show 20 Lines

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare <256 x double> @llvm.ve.vl.vbrds.vsmvl(float, <256 x i1>, <256 x double>, i32)			declare <256 x double> @llvm.ve.vl.vbrds.vsmvl(float, <256 x i1>, <256 x double>, i32)

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @vbrdw_vsl(i32 signext %0, i8* %1) {			define void @vbrdw_vsl(i32 signext %0, i8* %1) {
	; CHECK-LABEL: vbrdw_vsl:			; CHECK-LABEL: vbrdw_vsl:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1			; CHECK-NEXT: and %s0, %s0, (32)0
	; CHECK-NEXT: lea %s2, 256			; CHECK-NEXT: lea %s2, 256
	; CHECK-NEXT: lvl %s2			; CHECK-NEXT: lvl %s2
	; CHECK-NEXT: vbrdl %v0, %s0			; CHECK-NEXT: vbrdl %v0, %s0
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: vst %v0, 8, %s1			; CHECK-NEXT: vst %v0, 8, %s1
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%3 = tail call fast <256 x double> @llvm.ve.vl.vbrdw.vsl(i32 %0, i32 256)			%3 = tail call fast <256 x double> @llvm.ve.vl.vbrdw.vsl(i32 %0, i32 256)
	tail call void asm sideeffect "vst ${0:v}, 8, $1", "v,r"(<256 x double> %3, i8* %1)			tail call void asm sideeffect "vst ${0:v}, 8, $1", "v,r"(<256 x double> %3, i8* %1)
	ret void			ret void
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare <256 x double> @llvm.ve.vl.vbrdw.vsl(i32, i32)			declare <256 x double> @llvm.ve.vl.vbrdw.vsl(i32, i32)

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @vbrdw_vsvl(i32 signext %0, i8* %1) {			define void @vbrdw_vsvl(i32 signext %0, i8* %1) {
	; CHECK-LABEL: vbrdw_vsvl:			; CHECK-LABEL: vbrdw_vsvl:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s2, 256			; CHECK-NEXT: lea %s2, 256
	; CHECK-NEXT: lvl %s2			; CHECK-NEXT: lvl %s2
	; CHECK-NEXT: vld %v0, 8, %s1			; CHECK-NEXT: vld %v0, 8, %s1
	; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1			; CHECK-NEXT: and %s0, %s0, (32)0
	; CHECK-NEXT: vbrdl %v0, %s0			; CHECK-NEXT: vbrdl %v0, %s0
	; CHECK-NEXT: vst %v0, 8, %s1			; CHECK-NEXT: vst %v0, 8, %s1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %1, i32 256)			%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %1, i32 256)
	%4 = tail call fast <256 x double> @llvm.ve.vl.vbrdw.vsvl(i32 %0, <256 x double> %3, i32 256)			%4 = tail call fast <256 x double> @llvm.ve.vl.vbrdw.vsvl(i32 %0, <256 x double> %3, i32 256)
	tail call void @llvm.ve.vl.vst.vssl(<256 x double> %4, i64 8, i8* %1, i32 256)			tail call void @llvm.ve.vl.vst.vssl(<256 x double> %4, i64 8, i8* %1, i32 256)
	ret void			ret void
	}			}

	; Function Attrs: nounwind readnone			; Function Attrs: nounwind readnone
	declare <256 x double> @llvm.ve.vl.vbrdw.vsvl(i32, <256 x double>, i32)			declare <256 x double> @llvm.ve.vl.vbrdw.vsvl(i32, <256 x double>, i32)

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define void @vbrdw_vsmvl(i32 signext %0, i8* %1) {			define void @vbrdw_vsmvl(i32 signext %0, i8* %1) {
	; CHECK-LABEL: vbrdw_vsmvl:			; CHECK-LABEL: vbrdw_vsmvl:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s2, 256			; CHECK-NEXT: lea %s2, 256
	; CHECK-NEXT: lvl %s2			; CHECK-NEXT: lvl %s2
	; CHECK-NEXT: vld %v0, 8, %s1			; CHECK-NEXT: vld %v0, 8, %s1
	; CHECK-NEXT: adds.w.sx %s3, %s0, (0)1			; CHECK-NEXT: and %s3, %s0, (32)0
	; CHECK-NEXT: lvm %vm1, 3, %s0			; CHECK-NEXT: lvm %vm1, 3, %s0
	; CHECK-NEXT: vbrdl %v0, %s3, %vm1			; CHECK-NEXT: vbrdl %v0, %s3, %vm1
	; CHECK-NEXT: vst %v0, 8, %s1			; CHECK-NEXT: vst %v0, 8, %s1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %1, i32 256)			%3 = tail call fast <256 x double> @llvm.ve.vl.vld.vssl(i64 8, i8* %1, i32 256)
	%4 = sext i32 %0 to i64			%4 = sext i32 %0 to i64
	%5 = tail call <256 x i1> @llvm.ve.vl.lvm.mmss(<256 x i1> undef, i64 3, i64 %4)			%5 = tail call <256 x i1> @llvm.ve.vl.lvm.mmss(<256 x i1> undef, i64 3, i64 %4)
	%6 = tail call fast <256 x double> @llvm.ve.vl.vbrdw.vsmvl(i32 %0, <256 x i1> %5, <256 x double> %3, i32 256)			%6 = tail call fast <256 x double> @llvm.ve.vl.vbrdw.vsmvl(i32 %0, <256 x i1> %5, <256 x double> %3, i32 256)
	▲ Show 20 Lines • Show All 121 Lines • Show Last 20 Lines

llvm/test/CodeGen/VE/Vector/vec_add.ll

	; RUN: llc < %s -mtriple=ve -mattr=+vpu \| FileCheck %s			; RUN: llc < %s -mtriple=ve -mattr=+vpu \| FileCheck %s

	; <256 x i32>			; <256 x i32>

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i32> @add_vv_v256i32(<256 x i32> %x, <256 x i32> %y) {			define fastcc <256 x i32> @add_vv_v256i32(<256 x i32> %x, <256 x i32> %y) {
	; CHECK-LABEL: add_vv_v256i32:			; CHECK-LABEL: add_vv_v256i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s0, 256			; CHECK-NEXT: lea %s0, 256
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vadds.w.sx %v0, %v0, %v1			; CHECK-NEXT: vadds.w.sx %v0, %v0, %v1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%z = add <256 x i32> %x, %y			%z = add <256 x i32> %x, %y
	ret <256 x i32> %z			ret <256 x i32> %z
	}			}

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i32> @add_sv_v256i32(i32 %x, <256 x i32> %y) {			define fastcc <256 x i32> @add_sv_v256i32(i32 %x, <256 x i32> %y) {
	; CHECK-LABEL: add_sv_v256i32:			; CHECK-LABEL: add_sv_v256i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1			; CHECK-NEXT: and %s0, %s0, (32)0
	; CHECK-NEXT: lea %s1, 256			; CHECK-NEXT: lea %s1, 256
	; CHECK-NEXT: lvl %s1			; CHECK-NEXT: lvl %s1
	; CHECK-NEXT: vadds.w.sx %v0, %s0, %v0			; CHECK-NEXT: vadds.w.sx %v0, %s0, %v0
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%xins = insertelement <256 x i32> undef, i32 %x, i32 0			%xins = insertelement <256 x i32> undef, i32 %x, i32 0
	%vx = shufflevector <256 x i32> %xins, <256 x i32> undef, <256 x i32> zeroinitializer			%vx = shufflevector <256 x i32> %xins, <256 x i32> undef, <256 x i32> zeroinitializer
	%z = add <256 x i32> %vx, %y			%z = add <256 x i32> %vx, %y
	ret <256 x i32> %z			ret <256 x i32> %z
	}			}

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i32> @add_vs_v256i32(<256 x i32> %x, i32 %y) {			define fastcc <256 x i32> @add_vs_v256i32(<256 x i32> %x, i32 %y) {
	; CHECK-LABEL: add_vs_v256i32:			; CHECK-LABEL: add_vs_v256i32:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1			; CHECK-NEXT: and %s0, %s0, (32)0
	; CHECK-NEXT: lea %s1, 256			; CHECK-NEXT: lea %s1, 256
	; CHECK-NEXT: lvl %s1			; CHECK-NEXT: lvl %s1
	; CHECK-NEXT: vadds.w.sx %v0, %s0, %v0			; CHECK-NEXT: vadds.w.sx %v0, %s0, %v0
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%yins = insertelement <256 x i32> undef, i32 %y, i32 0			%yins = insertelement <256 x i32> undef, i32 %y, i32 0
	%vy = shufflevector <256 x i32> %yins, <256 x i32> undef, <256 x i32> zeroinitializer			%vy = shufflevector <256 x i32> %yins, <256 x i32> undef, <256 x i32> zeroinitializer
	%z = add <256 x i32> %x, %vy			%z = add <256 x i32> %x, %vy
	ret <256 x i32> %z			ret <256 x i32> %z
	}			}



	; <256 x i64>			; <256 x i64>

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i64> @add_vv_v256i64(<256 x i64> %x, <256 x i64> %y) {			define fastcc <256 x i64> @add_vv_v256i64(<256 x i64> %x, <256 x i64> %y) {
	; CHECK-LABEL: add_vv_v256i64:			; CHECK-LABEL: add_vv_v256i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s0, 256			; CHECK-NEXT: lea %s0, 256
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vadds.l %v0, %v0, %v1			; CHECK-NEXT: vadds.l %v0, %v0, %v1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%z = add <256 x i64> %x, %y			%z = add <256 x i64> %x, %y
	ret <256 x i64> %z			ret <256 x i64> %z
	}			}

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i64> @add_sv_v256i64(i64 %x, <256 x i64> %y) {			define fastcc <256 x i64> @add_sv_v256i64(i64 %x, <256 x i64> %y) {
	; CHECK-LABEL: add_sv_v256i64:			; CHECK-LABEL: add_sv_v256i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s1, 256			; CHECK-NEXT: lea %s1, 256
	; CHECK-NEXT: lvl %s1			; CHECK-NEXT: lvl %s1
	; CHECK-NEXT: vadds.l %v0, %s0, %v0			; CHECK-NEXT: vadds.l %v0, %s0, %v0
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%xins = insertelement <256 x i64> undef, i64 %x, i32 0			%xins = insertelement <256 x i64> undef, i64 %x, i32 0
	%vx = shufflevector <256 x i64> %xins, <256 x i64> undef, <256 x i32> zeroinitializer			%vx = shufflevector <256 x i64> %xins, <256 x i64> undef, <256 x i32> zeroinitializer
	%z = add <256 x i64> %vx, %y			%z = add <256 x i64> %vx, %y
	ret <256 x i64> %z			ret <256 x i64> %z
	}			}

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i64> @add_vs_v256i64(<256 x i64> %x, i64 %y) {			define fastcc <256 x i64> @add_vs_v256i64(<256 x i64> %x, i64 %y) {
	; CHECK-LABEL: add_vs_v256i64:			; CHECK-LABEL: add_vs_v256i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s1, 256			; CHECK-NEXT: lea %s1, 256
	; CHECK-NEXT: lvl %s1			; CHECK-NEXT: lvl %s1
	; CHECK-NEXT: vadds.l %v0, %s0, %v0			; CHECK-NEXT: vadds.l %v0, %s0, %v0
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%yins = insertelement <256 x i64> undef, i64 %y, i32 0			%yins = insertelement <256 x i64> undef, i64 %y, i32 0
	%vy = shufflevector <256 x i64> %yins, <256 x i64> undef, <256 x i32> zeroinitializer			%vy = shufflevector <256 x i64> %yins, <256 x i64> undef, <256 x i32> zeroinitializer
	%z = add <256 x i64> %x, %vy			%z = add <256 x i64> %x, %vy
	ret <256 x i64> %z			ret <256 x i64> %z
	}			}

	; <128 x i64>			; <128 x i64>
	; We expect this to be widened.			; We expect this to be widened.

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <128 x i64> @add_vv_v128i64(<128 x i64> %x, <128 x i64> %y) {			define fastcc <128 x i64> @add_vv_v128i64(<128 x i64> %x, <128 x i64> %y) {
	; CHECK-LABEL: add_vv_v128i64:			; CHECK-LABEL: add_vv_v128i64:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s0, 256			; CHECK-NEXT: lea %s0, 256
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vadds.l %v0, %v0, %v1			; CHECK-NEXT: vadds.l %v0, %v0, %v1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%z = add <128 x i64> %x, %y			%z = add <128 x i64> %x, %y
	ret <128 x i64> %z			ret <128 x i64> %z
	}			}

	; <256 x i16>			; <256 x i16>
	; We expect promotion.			; We expect promotion.

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <256 x i16> @add_vv_v256i16(<256 x i16> %x, <256 x i16> %y) {			define fastcc <256 x i16> @add_vv_v256i16(<256 x i16> %x, <256 x i16> %y) {
	; CHECK-LABEL: add_vv_v256i16:			; CHECK-LABEL: add_vv_v256i16:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: lea %s0, 256			; CHECK-NEXT: lea %s0, 256
	; CHECK-NEXT: lvl %s0			; CHECK-NEXT: lvl %s0
	; CHECK-NEXT: vadds.w.sx %v0, %v0, %v1			; CHECK-NEXT: vadds.w.sx %v0, %v0, %v1
	; CHECK-NEXT: b.l.t (, %s10)			; CHECK-NEXT: b.l.t (, %s10)
	%z = add <256 x i16> %x, %y			%z = add <256 x i16> %x, %y
	ret <256 x i16> %z			ret <256 x i16> %z
	}			}

	; <128 x i16>			; <128 x i16>
	; We expect this to be scalarized (for now).			; We expect this to be scalarized (for now).

	; Function Attrs: nounwind			; Function Attrs: nounwind
	define fastcc <128 x i16> @add_vv_v128i16(<128 x i16> %x, <128 x i16> %y) {			define fastcc <128 x i16> @add_vv_v128i16(<128 x i16> %x, <128 x i16> %y) {
	; CHECK-LABEL: add_vv_v128i16:			; CHECK-LABEL: add_vv_v128i16:
	; CHECK: # %bb.0:
	; CHECK-NOT: vadd			; CHECK-NOT: vadd
	%z = add <128 x i16> %x, %y			%z = add <128 x i16> %x, %y
	ret <128 x i16> %z			ret <128 x i16> %z
	}			}

llvm/test/CodeGen/VE/Vector/vec_broadcast.ll

Show First 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
%val = insertelement <256 x double> undef, double 0.e+00, i32 0		%val = insertelement <256 x double> undef, double 0.e+00, i32 0
%ret = shufflevector <256 x double> %val, <256 x double> undef, <256 x i32> zeroinitializer		%ret = shufflevector <256 x double> %val, <256 x double> undef, <256 x i32> zeroinitializer
ret <256 x double> %ret		ret <256 x double> %ret
}		}

define fastcc <256 x i32> @brd_v256i32(i32 %s) {		define fastcc <256 x i32> @brd_v256i32(i32 %s) {
; CHECK-LABEL: brd_v256i32:		; CHECK-LABEL: brd_v256i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: lea %s1, 256		; CHECK-NEXT: lea %s1, 256
; CHECK-NEXT: lvl %s1		; CHECK-NEXT: lvl %s1
; CHECK-NEXT: vbrd %v0, %s0		; CHECK-NEXT: vbrd %v0, %s0
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%val = insertelement <256 x i32> undef, i32 %s, i32 0		%val = insertelement <256 x i32> undef, i32 %s, i32 0
%ret = shufflevector <256 x i32> %val, <256 x i32> undef, <256 x i32> zeroinitializer		%ret = shufflevector <256 x i32> %val, <256 x i32> undef, <256 x i32> zeroinitializer
ret <256 x i32> %ret		ret <256 x i32> %ret
}		}
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines	; CHECK-NEXT: b.l.t (, %s10)
%val = insertelement <128 x double> undef, double %s, i32 0		%val = insertelement <128 x double> undef, double %s, i32 0
%ret = shufflevector <128 x double> %val, <128 x double> undef, <128 x i32> zeroinitializer		%ret = shufflevector <128 x double> %val, <128 x double> undef, <128 x i32> zeroinitializer
ret <128 x double> %ret		ret <128 x double> %ret
}		}

define fastcc <128 x i32> @brd_v128i32(i32 %s) {		define fastcc <128 x i32> @brd_v128i32(i32 %s) {
; CHECK-LABEL: brd_v128i32:		; CHECK-LABEL: brd_v128i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: lea %s1, 256		; CHECK-NEXT: lea %s1, 256
; CHECK-NEXT: lvl %s1		; CHECK-NEXT: lvl %s1
; CHECK-NEXT: vbrd %v0, %s0		; CHECK-NEXT: vbrd %v0, %s0
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%val = insertelement <128 x i32> undef, i32 %s, i32 0		%val = insertelement <128 x i32> undef, i32 %s, i32 0
%ret = shufflevector <128 x i32> %val, <128 x i32> undef, <128 x i32> zeroinitializer		%ret = shufflevector <128 x i32> %val, <128 x i32> undef, <128 x i32> zeroinitializer
ret <128 x i32> %ret		ret <128 x i32> %ret
}		}
Show All 33 Lines	; CHECK-NEXT: b.l.t (, %s10)
%ret = shufflevector <128 x float> %val, <128 x float> undef, <128 x i32> zeroinitializer		%ret = shufflevector <128 x float> %val, <128 x float> undef, <128 x i32> zeroinitializer
ret <128 x float> %ret		ret <128 x float> %ret
}		}

; Vectors with small element types and valid element count, we expect those to be promoted.		; Vectors with small element types and valid element count, we expect those to be promoted.
define fastcc <256 x i16> @brd_v256i16(i16 %s) {		define fastcc <256 x i16> @brd_v256i16(i16 %s) {
; CHECK-LABEL: brd_v256i16:		; CHECK-LABEL: brd_v256i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s0, %s0, (0)1		; CHECK-NEXT: and %s0, %s0, (32)0
; CHECK-NEXT: lea %s1, 256		; CHECK-NEXT: lea %s1, 256
; CHECK-NEXT: lvl %s1		; CHECK-NEXT: lvl %s1
; CHECK-NEXT: vbrd %v0, %s0		; CHECK-NEXT: vbrd %v0, %s0
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%val = insertelement <256 x i16> undef, i16 %s, i32 0		%val = insertelement <256 x i16> undef, i16 %s, i32 0
%ret = shufflevector <256 x i16> %val, <256 x i16> undef, <256 x i32> zeroinitializer		%ret = shufflevector <256 x i16> %val, <256 x i16> undef, <256 x i32> zeroinitializer
ret <256 x i16> %ret		ret <256 x i16> %ret
}		}

; Vectors with small element types and low element count, these are scalarized for now.		; Vectors with small element types and low element count, these are scalarized for now.
; FIXME Promote + Widen		; FIXME Promote + Widen
define fastcc <128 x i16> @brd_v128i16(i16 %s) {		define fastcc <128 x i16> @brd_v128i16(i16 %s) {
; CHECK-LABEL: brd_v128i16:		; CHECK-LABEL: brd_v128i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: adds.w.sx %s1, %s1, (0)1		; CHECK-NEXT: and %s1, %s1, (32)0
; CHECK-NEXT: st2b %s1, 254(, %s0)		; CHECK-NEXT: st2b %s1, 254(, %s0)
; CHECK-NEXT: st2b %s1, 252(, %s0)		; CHECK-NEXT: st2b %s1, 252(, %s0)
; CHECK-NEXT: st2b %s1, 250(, %s0)		; CHECK-NEXT: st2b %s1, 250(, %s0)
; CHECK-NEXT: st2b %s1, 248(, %s0)		; CHECK-NEXT: st2b %s1, 248(, %s0)
; CHECK-NEXT: st2b %s1, 246(, %s0)		; CHECK-NEXT: st2b %s1, 246(, %s0)
; CHECK-NEXT: st2b %s1, 244(, %s0)		; CHECK-NEXT: st2b %s1, 244(, %s0)
; CHECK-NEXT: st2b %s1, 242(, %s0)		; CHECK-NEXT: st2b %s1, 242(, %s0)
; CHECK-NEXT: st2b %s1, 240(, %s0)		; CHECK-NEXT: st2b %s1, 240(, %s0)
; CHECK-NEXT: st2b %s1, 238(, %s0)		; CHECK-NEXT: st2b %s1, 238(, %s0)
; CHECK-NEXT: st2b %s1, 236(, %s0)		; CHECK-NEXT: st2b %s1, 236(, %s0)
; CHECK-NEXT: st2b %s1, 234(, %s0)		; CHECK-NEXT: st2b %s1, 234(, %s0)
; CHECK-NEXT: st2b %s1, 232(, %s0)		; CHECK-NEXT: st2b %s1, 232(, %s0)
; CHECK-NEXT: st2b %s1, 230(, %s0)		; CHECK-NEXT: st2b %s1, 230(, %s0)
; CHECK-NEXT: st2b %s1, 228(, %s0)		; CHECK-NEXT: st2b %s1, 228(, %s0)
; CHECK-NEXT: st2b %s1, 226(, %s0)		; CHECK-NEXT: st2b %s1, 226(, %s0)
; CHECK-NEXT: st2b %s1, 224(, %s0)		; CHECK-NEXT: st2b %s1, 224(, %s0)
; CHECK-NEXT: st2b %s1, 222(, %s0)		; CHECK-NEXT: st2b %s1, 222(, %s0)
; CHECK-NEXT: st2b %s1, 220(, %s0)		; CHECK-NEXT: st2b %s1, 220(, %s0)
; CHECK-NEXT: st2b %s1, 218(, %s0)		; CHECK-NEXT: st2b %s1, 218(, %s0)
; CHECK-NEXT: st2b %s1, 216(, %s0)		; CHECK-NEXT: st2b %s1, 216(, %s0)
; CHECK-NEXT: st2b %s1, 214(, %s0)		; CHECK-NEXT: st2b %s1, 214(, %s0)
; CHECK-NEXT: st2b %s1, 212(, %s0)		; CHECK-NEXT: st2b %s1, 212(, %s0)
; CHECK-NEXT: st2b %s1, 210(, %s0)		; CHECK-NEXT: st2b %s1, 210(, %s0)
; CHECK-NEXT: st2b %s1, 208(, %s0)		; CHECK-NEXT: st2b %s1, 208(, %s0)
; CHECK-NEXT: st2b %s1, 206(, %s0)		; CHECK-NEXT: st2b %s1, 206(, %s0)
; CHECK-NEXT: st2b %s1, 204(, %s0)		; CHECK-NEXT: st2b %s1, 204(, %s0)
; CHECK-NEXT: st2b %s1, 202(, %s0)		; CHECK-NEXT: st2b %s1, 202(, %s0)
; CHECK-NEXT: st2b %s1, 200(, %s0)		; CHECK-NEXT: st2b %s1, 200(, %s0)
; CHECK-NEXT: st2b %s1, 198(, %s0)		; CHECK-NEXT: st2b %s1, 198(, %s0)
; CHECK-NEXT: st2b %s1, 196(, %s0)		; CHECK-NEXT: st2b %s1, 196(, %s0)
; CHECK-NEXT: st2b %s1, 194(, %s0)		; CHECK-NEXT: st2b %s1, 194(, %s0)
; CHECK-NEXT: st2b %s1, 192(, %s0)		; CHECK-NEXT: st2b %s1, 192(, %s0)
; CHECK-NEXT: st2b %s1, 190(, %s0)		; CHECK-NEXT: st2b %s1, 190(, %s0)
; CHECK-NEXT: st2b %s1, 188(, %s0)		; CHECK-NEXT: st2b %s1, 188(, %s0)
; CHECK-NEXT: st2b %s1, 186(, %s0)		; CHECK-NEXT: st2b %s1, 186(, %s0)
; CHECK-NEXT: st2b %s1, 184(, %s0)		; CHECK-NEXT: st2b %s1, 184(, %s0)
; CHECK-NEXT: st2b %s1, 182(, %s0)		; CHECK-NEXT: st2b %s1, 182(, %s0)
; CHECK-NEXT: st2b %s1, 180(, %s0)		; CHECK-NEXT: st2b %s1, 180(, %s0)
; CHECK-NEXT: st2b %s1, 178(, %s0)		; CHECK-NEXT: st2b %s1, 178(, %s0)
; CHECK-NEXT: st2b %s1, 176(, %s0)		; CHECK-NEXT: st2b %s1, 176(, %s0)
; CHECK-NEXT: st2b %s1, 174(, %s0)		; CHECK-NEXT: st2b %s1, 174(, %s0)
; CHECK-NEXT: st2b %s1, 172(, %s0)		; CHECK-NEXT: st2b %s1, 172(, %s0)
; CHECK-NEXT: st2b %s1, 170(, %s0)		; CHECK-NEXT: st2b %s1, 170(, %s0)
; CHECK-NEXT: st2b %s1, 168(, %s0)		; CHECK-NEXT: st2b %s1, 168(, %s0)
; CHECK-NEXT: st2b %s1, 166(, %s0)		; CHECK-NEXT: st2b %s1, 166(, %s0)
; CHECK-NEXT: st2b %s1, 164(, %s0)		; CHECK-NEXT: st2b %s1, 164(, %s0)
; CHECK-NEXT: st2b %s1, 162(, %s0)		; CHECK-NEXT: st2b %s1, 162(, %s0)
; CHECK-NEXT: st2b %s1, 160(, %s0)		; CHECK-NEXT: st2b %s1, 160(, %s0)
; CHECK-NEXT: st2b %s1, 158(, %s0)		; CHECK-NEXT: st2b %s1, 158(, %s0)
; CHECK-NEXT: st2b %s1, 156(, %s0)		; CHECK-NEXT: st2b %s1, 156(, %s0)
; CHECK-NEXT: st2b %s1, 154(, %s0)		; CHECK-NEXT: st2b %s1, 154(, %s0)
; CHECK-NEXT: st2b %s1, 152(, %s0)		; CHECK-NEXT: st2b %s1, 152(, %s0)
; CHECK-NEXT: st2b %s1, 150(, %s0)		; CHECK-NEXT: st2b %s1, 150(, %s0)
; CHECK-NEXT: st2b %s1, 148(, %s0)		; CHECK-NEXT: st2b %s1, 148(, %s0)
; CHECK-NEXT: st2b %s1, 146(, %s0)		; CHECK-NEXT: st2b %s1, 146(, %s0)
; CHECK-NEXT: st2b %s1, 144(, %s0)		; CHECK-NEXT: st2b %s1, 144(, %s0)
; CHECK-NEXT: st2b %s1, 142(, %s0)		; CHECK-NEXT: st2b %s1, 142(, %s0)
; CHECK-NEXT: st2b %s1, 140(, %s0)		; CHECK-NEXT: st2b %s1, 140(, %s0)
; CHECK-NEXT: st2b %s1, 138(, %s0)		; CHECK-NEXT: st2b %s1, 138(, %s0)
; CHECK-NEXT: st2b %s1, 136(, %s0)		; CHECK-NEXT: st2b %s1, 136(, %s0)
; CHECK-NEXT: st2b %s1, 134(, %s0)		; CHECK-NEXT: st2b %s1, 134(, %s0)
; CHECK-NEXT: st2b %s1, 132(, %s0)		; CHECK-NEXT: st2b %s1, 132(, %s0)
; CHECK-NEXT: st2b %s1, 130(, %s0)		; CHECK-NEXT: st2b %s1, 130(, %s0)
; CHECK-NEXT: st2b %s1, 128(, %s0)		; CHECK-NEXT: st2b %s1, 128(, %s0)
; CHECK-NEXT: st2b %s1, 126(, %s0)		; CHECK-NEXT: st2b %s1, 126(, %s0)
; CHECK-NEXT: st2b %s1, 124(, %s0)		; CHECK-NEXT: st2b %s1, 124(, %s0)
; CHECK-NEXT: st2b %s1, 122(, %s0)		; CHECK-NEXT: st2b %s1, 122(, %s0)
; CHECK-NEXT: st2b %s1, 120(, %s0)		; CHECK-NEXT: st2b %s1, 120(, %s0)
; CHECK-NEXT: st2b %s1, 118(, %s0)		; CHECK-NEXT: st2b %s1, 118(, %s0)
; CHECK-NEXT: st2b %s1, 116(, %s0)		; CHECK-NEXT: st2b %s1, 116(, %s0)
; CHECK-NEXT: st2b %s1, 114(, %s0)		; CHECK-NEXT: st2b %s1, 114(, %s0)
; CHECK-NEXT: st2b %s1, 112(, %s0)		; CHECK-NEXT: st2b %s1, 112(, %s0)
; CHECK-NEXT: st2b %s1, 110(, %s0)		; CHECK-NEXT: st2b %s1, 110(, %s0)
; CHECK-NEXT: st2b %s1, 108(, %s0)		; CHECK-NEXT: st2b %s1, 108(, %s0)
; CHECK-NEXT: st2b %s1, 106(, %s0)		; CHECK-NEXT: st2b %s1, 106(, %s0)
; CHECK-NEXT: st2b %s1, 104(, %s0)		; CHECK-NEXT: st2b %s1, 104(, %s0)
; CHECK-NEXT: st2b %s1, 102(, %s0)		; CHECK-NEXT: st2b %s1, 102(, %s0)
; CHECK-NEXT: st2b %s1, 100(, %s0)		; CHECK-NEXT: st2b %s1, 100(, %s0)
; CHECK-NEXT: st2b %s1, 98(, %s0)		; CHECK-NEXT: st2b %s1, 98(, %s0)
; CHECK-NEXT: st2b %s1, 96(, %s0)		; CHECK-NEXT: st2b %s1, 96(, %s0)
; CHECK-NEXT: st2b %s1, 94(, %s0)		; CHECK-NEXT: st2b %s1, 94(, %s0)
; CHECK-NEXT: st2b %s1, 92(, %s0)		; CHECK-NEXT: st2b %s1, 92(, %s0)
; CHECK-NEXT: st2b %s1, 90(, %s0)		; CHECK-NEXT: st2b %s1, 90(, %s0)
; CHECK-NEXT: st2b %s1, 88(, %s0)		; CHECK-NEXT: st2b %s1, 88(, %s0)
; CHECK-NEXT: st2b %s1, 86(, %s0)		; CHECK-NEXT: st2b %s1, 86(, %s0)
; CHECK-NEXT: st2b %s1, 84(, %s0)		; CHECK-NEXT: st2b %s1, 84(, %s0)
; CHECK-NEXT: st2b %s1, 82(, %s0)		; CHECK-NEXT: st2b %s1, 82(, %s0)
; CHECK-NEXT: st2b %s1, 80(, %s0)		; CHECK-NEXT: st2b %s1, 80(, %s0)
; CHECK-NEXT: st2b %s1, 78(, %s0)		; CHECK-NEXT: st2b %s1, 78(, %s0)
; CHECK-NEXT: st2b %s1, 76(, %s0)		; CHECK-NEXT: st2b %s1, 76(, %s0)
; CHECK-NEXT: st2b %s1, 74(, %s0)		; CHECK-NEXT: st2b %s1, 74(, %s0)
; CHECK-NEXT: st2b %s1, 72(, %s0)		; CHECK-NEXT: st2b %s1, 72(, %s0)
; CHECK-NEXT: st2b %s1, 70(, %s0)		; CHECK-NEXT: st2b %s1, 70(, %s0)
; CHECK-NEXT: st2b %s1, 68(, %s0)		; CHECK-NEXT: st2b %s1, 68(, %s0)
; CHECK-NEXT: st2b %s1, 66(, %s0)		; CHECK-NEXT: st2b %s1, 66(, %s0)
; CHECK-NEXT: st2b %s1, 64(, %s0)		; CHECK-NEXT: st2b %s1, 64(, %s0)
; CHECK-NEXT: st2b %s1, 62(, %s0)		; CHECK-NEXT: st2b %s1, 62(, %s0)
; CHECK-NEXT: st2b %s1, 60(, %s0)		; CHECK-NEXT: st2b %s1, 60(, %s0)
; CHECK-NEXT: st2b %s1, 58(, %s0)		; CHECK-NEXT: st2b %s1, 58(, %s0)
; CHECK-NEXT: st2b %s1, 56(, %s0)		; CHECK-NEXT: st2b %s1, 56(, %s0)
; CHECK-NEXT: st2b %s1, 54(, %s0)		; CHECK-NEXT: st2b %s1, 54(, %s0)
; CHECK-NEXT: st2b %s1, 52(, %s0)		; CHECK-NEXT: st2b %s1, 52(, %s0)
; CHECK-NEXT: st2b %s1, 50(, %s0)		; CHECK-NEXT: st2b %s1, 50(, %s0)
; CHECK-NEXT: st2b %s1, 48(, %s0)		; CHECK-NEXT: st2b %s1, 48(, %s0)
; CHECK-NEXT: st2b %s1, 46(, %s0)		; CHECK-NEXT: st2b %s1, 46(, %s0)
; CHECK-NEXT: st2b %s1, 44(, %s0)		; CHECK-NEXT: st2b %s1, 44(, %s0)
; CHECK-NEXT: st2b %s1, 42(, %s0)		; CHECK-NEXT: st2b %s1, 42(, %s0)
; CHECK-NEXT: st2b %s1, 40(, %s0)		; CHECK-NEXT: st2b %s1, 40(, %s0)
; CHECK-NEXT: st2b %s1, 38(, %s0)		; CHECK-NEXT: st2b %s1, 38(, %s0)
; CHECK-NEXT: st2b %s1, 36(, %s0)		; CHECK-NEXT: st2b %s1, 36(, %s0)
; CHECK-NEXT: st2b %s1, 34(, %s0)		; CHECK-NEXT: st2b %s1, 34(, %s0)
; CHECK-NEXT: st2b %s1, 32(, %s0)		; CHECK-NEXT: st2b %s1, 32(, %s0)
; CHECK-NEXT: st2b %s1, 30(, %s0)		; CHECK-NEXT: st2b %s1, 30(, %s0)
; CHECK-NEXT: st2b %s1, 28(, %s0)		; CHECK-NEXT: st2b %s1, 28(, %s0)
; CHECK-NEXT: st2b %s1, 26(, %s0)		; CHECK-NEXT: st2b %s1, 26(, %s0)
; CHECK-NEXT: st2b %s1, 24(, %s0)		; CHECK-NEXT: st2b %s1, 24(, %s0)
; CHECK-NEXT: st2b %s1, 22(, %s0)		; CHECK-NEXT: st2b %s1, 22(, %s0)
; CHECK-NEXT: st2b %s1, 20(, %s0)		; CHECK-NEXT: st2b %s1, 20(, %s0)
; CHECK-NEXT: st2b %s1, 18(, %s0)		; CHECK-NEXT: st2b %s1, 18(, %s0)
; CHECK-NEXT: st2b %s1, 16(, %s0)		; CHECK-NEXT: st2b %s1, 16(, %s0)
; CHECK-NEXT: st2b %s1, 14(, %s0)		; CHECK-NEXT: st2b %s1, 14(, %s0)
; CHECK-NEXT: st2b %s1, 12(, %s0)		; CHECK-NEXT: st2b %s1, 12(, %s0)
; CHECK-NEXT: st2b %s1, 10(, %s0)		; CHECK-NEXT: st2b %s1, 10(, %s0)
; CHECK-NEXT: st2b %s1, 8(, %s0)		; CHECK-NEXT: st2b %s1, 8(, %s0)
; CHECK-NEXT: st2b %s1, 6(, %s0)		; CHECK-NEXT: st2b %s1, 6(, %s0)
; CHECK-NEXT: st2b %s1, 4(, %s0)		; CHECK-NEXT: st2b %s1, 4(, %s0)
; CHECK-NEXT: st2b %s1, 2(, %s0)		; CHECK-NEXT: st2b %s1, 2(, %s0)
; CHECK-NEXT: st2b %s1, (, %s0)		; CHECK-NEXT: st2b %s1, (, %s0)
; CHECK-NEXT: b.l.t (, %s10)		; CHECK-NEXT: b.l.t (, %s10)
%val = insertelement <128 x i16> undef, i16 %s, i32 0		%val = insertelement <128 x i16> undef, i16 %s, i32 0
%ret = shufflevector <128 x i16> %val, <128 x i16> undef, <128 x i32> zeroinitializer		%ret = shufflevector <128 x i16> %val, <128 x i16> undef, <128 x i32> zeroinitializer
ret <128 x i16> %ret		ret <128 x i16> %ret
}		}