This is an archive of the discontinued LLVM Phabricator instance.

ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply Add/Subtract.
ClosedPublic

Authored by labrinea on Nov 25 2015, 4:28 AM.

Download Raw Diff

Details

Reviewers

rengolin
t.p.northover
jmolloy
cfe-commits

Commits

rGcd8d97393267: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply…
rG502592c1d4b4: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply…
rC254251: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply
rC254250: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply
rL254251: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply
rL254250: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply

Summary

The following instructions are added to AArch32 instruction set:

VQRDMLAH: Vector Saturating Rounding Doubling Multiply Accumulate Returning High Half
VQRDMLSH: Vector Saturating Rounding Doubling Multiply Subtract Returning High Half

The following instructions are added to AArch64 instruction set:

SQRDMLAH: Signed Saturating Rounding Doubling Multiply Accumulate Returning High Half
SQRDMLSH: Signed Saturating Rounding Doubling Multiply Subtract Returning High Half

This patch adds intrinsic and ACLE macro support for these instructions, as well as corresponding tests.

Diff Detail

Repository: rL LLVM

Event Timeline

labrinea updated this revision to Diff 41128.Nov 25 2015, 4:28 AM

labrinea retitled this revision from to ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply Add/Subtract..

labrinea updated this object.

labrinea added reviewers: jmolloy, rengolin, cfe-commits.

Herald added subscribers: rengolin, aemerson. · View Herald TranscriptNov 25 2015, 4:28 AM

labrinea updated this object.Nov 25 2015, 5:04 AM

Do these get the right diagnostics when used on CPUs without the new feature? I can't see how __ARM_FEATURE_QRDMX gets wired through to arm_neon.h.

@t.p.northover you were right, my patch was missing predefined guard macros for the instrinsics. I've now updated the patch.

Thanks, LGTM!

Tim.

This revision is now accepted and ready to land.Nov 27 2015, 10:23 AM

Closed by commit rL254250: ARM v8.1a adds Advanced SIMD instructions for Rounding Double Multiply (authored by alelab01). · Explain WhyNov 29 2015, 2:46 AM

This revision was automatically updated to reflect the committed changes.

pengbins added a subscriber: pengbins.Feb 24 2021, 11:57 PM

pengbins added inline comments.

cfe/trunk/include/clang/Basic/arm_neon.td
377	@labrinea It seems QRDMLSH(p0, p1, p2) is not equivelent to with vqsub( p0, vqrdmulh(p1, p2)). QRDMLSH(p0, p1, p2) accum = ((p0 << esize) - 2 * (p1 * p2) + rounding_const); ret = SignedSatQ(accum >> esize, esize); p0<< esize + rounding_const vqsub( p0, vqrdmulh(p1, p2)) temp = SignedSatQ( (2 * (p1 * p2) + rounding_const) >> esize ); ret = SignedSat( p0 - temp); p0<< esize - rounding_const Here is an example where the results are not same. vqrdmlshq_s16 ( -197, -512, 11040) = -24 vqsubq_s16( -197, vqrdmulhq_n_s16(-512, 11040)) = -25

Herald added a subscriber: kristof.beyls. · View Herald TranscriptFeb 24 2021, 11:57 PM

Revision Contents

Path

Size

cfe/

trunk/

include/

clang/

Basic/

arm_neon.td

46 lines

lib/

Basic/

Targets.cpp

10 lines

test/

Preprocessor/

aarch64-target-features.c

3 lines

arm-target-features.c

1 line

Diff 41344

cfe/trunk/include/clang/Basic/arm_neon.td

Show First 20 Lines • Show All 367 Lines • ▼ Show 20 Lines
def OP_QDMLAL_LN : Op<(call "vqdmlal", $p0, $p1, (splat $p2, $p3))>;		def OP_QDMLAL_LN : Op<(call "vqdmlal", $p0, $p1, (splat $p2, $p3))>;
def OP_QDMLALHi_LN : Op<(call "vqdmlal", $p0, (call "vget_high", $p1),		def OP_QDMLALHi_LN : Op<(call "vqdmlal", $p0, (call "vget_high", $p1),
(splat $p2, $p3))>;		(splat $p2, $p3))>;
def OP_QDMLSL_LN : Op<(call "vqdmlsl", $p0, $p1, (splat $p2, $p3))>;		def OP_QDMLSL_LN : Op<(call "vqdmlsl", $p0, $p1, (splat $p2, $p3))>;
def OP_QDMLSLHi_LN : Op<(call "vqdmlsl", $p0, (call "vget_high", $p1),		def OP_QDMLSLHi_LN : Op<(call "vqdmlsl", $p0, (call "vget_high", $p1),
(splat $p2, $p3))>;		(splat $p2, $p3))>;
def OP_QDMULH_LN : Op<(call "vqdmulh", $p0, (splat $p1, $p2))>;		def OP_QDMULH_LN : Op<(call "vqdmulh", $p0, (splat $p1, $p2))>;
def OP_QRDMULH_LN : Op<(call "vqrdmulh", $p0, (splat $p1, $p2))>;		def OP_QRDMULH_LN : Op<(call "vqrdmulh", $p0, (splat $p1, $p2))>;
		def OP_QRDMLAH : Op<(call "vqadd", $p0, (call "vqrdmulh", $p1, $p2))>;
		def OP_QRDMLSH : Op<(call "vqsub", $p0, (call "vqrdmulh", $p1, $p2))>;
		pengbinsUnsubmitted Not Done Reply Inline Actions @labrinea It seems QRDMLSH(p0, p1, p2) is not equivelent to with vqsub( p0, vqrdmulh(p1, p2)). QRDMLSH(p0, p1, p2) accum = ((p0 << esize) - 2 * (p1 * p2) + rounding_const); ret = SignedSatQ(accum >> esize, esize); p0<< esize + rounding_const vqsub( p0, vqrdmulh(p1, p2)) temp = SignedSatQ( (2 * (p1 * p2) + rounding_const) >> esize ); ret = SignedSat( p0 - temp); p0<< esize - rounding_const Here is an example where the results are not same. vqrdmlshq_s16 ( -197, -512, 11040) = -24 vqsubq_s16( -197, vqrdmulhq_n_s16(-512, 11040)) = -25 pengbins: @labrinea It seems QRDMLSH(p0, p1, p2) is not equivelent to with vqsub( p0, vqrdmulh(p1, p2)).
		def OP_QRDMLAH_LN : Op<(call "vqadd", $p0, (call "vqrdmulh", $p1, (splat $p2, $p3)))>;
		def OP_QRDMLSH_LN : Op<(call "vqsub", $p0, (call "vqrdmulh", $p1, (splat $p2, $p3)))>;
def OP_FMS_LN : Op<(call "vfma_lane", $p0, $p1, (op "-", $p2), $p3)>;		def OP_FMS_LN : Op<(call "vfma_lane", $p0, $p1, (op "-", $p2), $p3)>;
def OP_FMS_LNQ : Op<(call "vfma_laneq", $p0, $p1, (op "-", $p2), $p3)>;		def OP_FMS_LNQ : Op<(call "vfma_laneq", $p0, $p1, (op "-", $p2), $p3)>;
def OP_TRN1 : Op<(shuffle $p0, $p1, (interleave (decimate mask0, 2),		def OP_TRN1 : Op<(shuffle $p0, $p1, (interleave (decimate mask0, 2),
(decimate mask1, 2)))>;		(decimate mask1, 2)))>;
def OP_ZIP1 : Op<(shuffle $p0, $p1, (lowhalf (interleave mask0, mask1)))>;		def OP_ZIP1 : Op<(shuffle $p0, $p1, (lowhalf (interleave mask0, mask1)))>;
def OP_UZP1 : Op<(shuffle $p0, $p1, (add (decimate mask0, 2),		def OP_UZP1 : Op<(shuffle $p0, $p1, (add (decimate mask0, 2),
(decimate mask1, 2)))>;		(decimate mask1, 2)))>;
def OP_TRN2 : Op<(shuffle $p0, $p1, (interleave		def OP_TRN2 : Op<(shuffle $p0, $p1, (interleave
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	def OP_SCALAR_VMULX_LNQ : LOp<[(save_temp $x, (call "vget_lane", $p0,
"0"))]>;		"0"))]>;
class ScalarMulOp<string opname> :		class ScalarMulOp<string opname> :
Op<(call opname, $p0, (call "vget_lane", $p1, $p2))>;		Op<(call opname, $p0, (call "vget_lane", $p1, $p2))>;

def OP_SCALAR_QDMULL_LN : ScalarMulOp<"vqdmull">;		def OP_SCALAR_QDMULL_LN : ScalarMulOp<"vqdmull">;
def OP_SCALAR_QDMULH_LN : ScalarMulOp<"vqdmulh">;		def OP_SCALAR_QDMULH_LN : ScalarMulOp<"vqdmulh">;
def OP_SCALAR_QRDMULH_LN : ScalarMulOp<"vqrdmulh">;		def OP_SCALAR_QRDMULH_LN : ScalarMulOp<"vqrdmulh">;

		def OP_SCALAR_QRDMLAH_LN : Op<(call "vqadd", $p0, (call "vqrdmulh", $p1,
		(call "vget_lane", $p2, $p3)))>;
		def OP_SCALAR_QRDMLSH_LN : Op<(call "vqsub", $p0, (call "vqrdmulh", $p1,
		(call "vget_lane", $p2, $p3)))>;

def OP_SCALAR_HALF_GET_LN : Op<(bitcast "float16_t",		def OP_SCALAR_HALF_GET_LN : Op<(bitcast "float16_t",
(call "vget_lane",		(call "vget_lane",
(bitcast "int16x4_t", $p0), $p1))>;		(bitcast "int16x4_t", $p0), $p1))>;
def OP_SCALAR_HALF_GET_LNQ : Op<(bitcast "float16_t",		def OP_SCALAR_HALF_GET_LNQ : Op<(bitcast "float16_t",
(call "vget_lane",		(call "vget_lane",
(bitcast "int16x8_t", $p0), $p1))>;		(bitcast "int16x8_t", $p0), $p1))>;
def OP_SCALAR_HALF_SET_LN : Op<(bitcast "float16x4_t",		def OP_SCALAR_HALF_SET_LN : Op<(bitcast "float16x4_t",
(call "vset_lane",		(call "vset_lane",
Show All 25 Lines
def VMUL : IOpInst<"vmul", "ddd", "csifUcUsUiQcQsQiQfQUcQUsQUi", OP_MUL>;		def VMUL : IOpInst<"vmul", "ddd", "csifUcUsUiQcQsQiQfQUcQUsQUi", OP_MUL>;
def VMULP : SInst<"vmul", "ddd", "PcQPc">;		def VMULP : SInst<"vmul", "ddd", "PcQPc">;
def VMLA : IOpInst<"vmla", "dddd", "csifUcUsUiQcQsQiQfQUcQUsQUi", OP_MLA>;		def VMLA : IOpInst<"vmla", "dddd", "csifUcUsUiQcQsQiQfQUcQUsQUi", OP_MLA>;
def VMLAL : SOpInst<"vmlal", "wwdd", "csiUcUsUi", OP_MLAL>;		def VMLAL : SOpInst<"vmlal", "wwdd", "csiUcUsUi", OP_MLAL>;
def VMLS : IOpInst<"vmls", "dddd", "csifUcUsUiQcQsQiQfQUcQUsQUi", OP_MLS>;		def VMLS : IOpInst<"vmls", "dddd", "csifUcUsUiQcQsQiQfQUcQUsQUi", OP_MLS>;
def VMLSL : SOpInst<"vmlsl", "wwdd", "csiUcUsUi", OP_MLSL>;		def VMLSL : SOpInst<"vmlsl", "wwdd", "csiUcUsUi", OP_MLSL>;
def VQDMULH : SInst<"vqdmulh", "ddd", "siQsQi">;		def VQDMULH : SInst<"vqdmulh", "ddd", "siQsQi">;
def VQRDMULH : SInst<"vqrdmulh", "ddd", "siQsQi">;		def VQRDMULH : SInst<"vqrdmulh", "ddd", "siQsQi">;

		let ArchGuard = "defined(__ARM_FEATURE_QRDMX)" in {
		def VQRDMLAH : SOpInst<"vqrdmlah", "dddd", "siQsQi", OP_QRDMLAH>;
		def VQRDMLSH : SOpInst<"vqrdmlsh", "dddd", "siQsQi", OP_QRDMLSH>;
		}

def VQDMLAL : SInst<"vqdmlal", "wwdd", "si">;		def VQDMLAL : SInst<"vqdmlal", "wwdd", "si">;
def VQDMLSL : SInst<"vqdmlsl", "wwdd", "si">;		def VQDMLSL : SInst<"vqdmlsl", "wwdd", "si">;
def VMULL : SInst<"vmull", "wdd", "csiUcUsUiPc">;		def VMULL : SInst<"vmull", "wdd", "csiUcUsUiPc">;
def VQDMULL : SInst<"vqdmull", "wdd", "si">;		def VQDMULL : SInst<"vqdmull", "wdd", "si">;

////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
// E.3.3 Subtraction		// E.3.3 Subtraction
def VSUB : IOpInst<"vsub", "ddd",		def VSUB : IOpInst<"vsub", "ddd",
▲ Show 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
def VMULL_N : SInst<"vmull_n", "wda", "siUsUi">;		def VMULL_N : SInst<"vmull_n", "wda", "siUsUi">;
def VMULL_LANE : SOpInst<"vmull_lane", "wddi", "siUsUi", OP_MULL_LN>;		def VMULL_LANE : SOpInst<"vmull_lane", "wddi", "siUsUi", OP_MULL_LN>;
def VQDMULL_N : SInst<"vqdmull_n", "wda", "si">;		def VQDMULL_N : SInst<"vqdmull_n", "wda", "si">;
def VQDMULL_LANE : SOpInst<"vqdmull_lane", "wddi", "si", OP_QDMULL_LN>;		def VQDMULL_LANE : SOpInst<"vqdmull_lane", "wddi", "si", OP_QDMULL_LN>;
def VQDMULH_N : SInst<"vqdmulh_n", "dda", "siQsQi">;		def VQDMULH_N : SInst<"vqdmulh_n", "dda", "siQsQi">;
def VQDMULH_LANE : SOpInst<"vqdmulh_lane", "ddgi", "siQsQi", OP_QDMULH_LN>;		def VQDMULH_LANE : SOpInst<"vqdmulh_lane", "ddgi", "siQsQi", OP_QDMULH_LN>;
def VQRDMULH_N : SInst<"vqrdmulh_n", "dda", "siQsQi">;		def VQRDMULH_N : SInst<"vqrdmulh_n", "dda", "siQsQi">;
def VQRDMULH_LANE : SOpInst<"vqrdmulh_lane", "ddgi", "siQsQi", OP_QRDMULH_LN>;		def VQRDMULH_LANE : SOpInst<"vqrdmulh_lane", "ddgi", "siQsQi", OP_QRDMULH_LN>;

		let ArchGuard = "defined(__ARM_FEATURE_QRDMX)" in {
		def VQRDMLAH_LANE : SOpInst<"vqrdmlah_lane", "dddgi", "siQsQi", OP_QRDMLAH_LN>;
		def VQRDMLSH_LANE : SOpInst<"vqrdmlsh_lane", "dddgi", "siQsQi", OP_QRDMLSH_LN>;
		}

def VMLA_N : IOpInst<"vmla_n", "ddda", "siUsUifQsQiQUsQUiQf", OP_MLA_N>;		def VMLA_N : IOpInst<"vmla_n", "ddda", "siUsUifQsQiQUsQUiQf", OP_MLA_N>;
def VMLAL_N : SOpInst<"vmlal_n", "wwda", "siUsUi", OP_MLAL_N>;		def VMLAL_N : SOpInst<"vmlal_n", "wwda", "siUsUi", OP_MLAL_N>;
def VQDMLAL_N : SInst<"vqdmlal_n", "wwda", "si">;		def VQDMLAL_N : SInst<"vqdmlal_n", "wwda", "si">;
def VMLS_N : IOpInst<"vmls_n", "ddds", "siUsUifQsQiQUsQUiQf", OP_MLS_N>;		def VMLS_N : IOpInst<"vmls_n", "ddds", "siUsUifQsQiQUsQUiQf", OP_MLS_N>;
def VMLSL_N : SOpInst<"vmlsl_n", "wwda", "siUsUi", OP_MLSL_N>;		def VMLSL_N : SOpInst<"vmlsl_n", "wwda", "siUsUi", OP_MLSL_N>;
def VQDMLSL_N : SInst<"vqdmlsl_n", "wwda", "si">;		def VQDMLSL_N : SInst<"vqdmlsl_n", "wwda", "si">;

////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
▲ Show 20 Lines • Show All 403 Lines • ▼ Show 20 Lines
def VQDMULL_HIGH_LANE : SOpInst<"vqdmull_high_lane", "wkdi", "si",		def VQDMULL_HIGH_LANE : SOpInst<"vqdmull_high_lane", "wkdi", "si",
OP_QDMULLHi_LN>;		OP_QDMULLHi_LN>;
def VQDMULL_HIGH_LANEQ : SOpInst<"vqdmull_high_laneq", "wkki", "si",		def VQDMULL_HIGH_LANEQ : SOpInst<"vqdmull_high_laneq", "wkki", "si",
OP_QDMULLHi_LN>;		OP_QDMULLHi_LN>;

def VQDMULH_LANEQ : SOpInst<"vqdmulh_laneq", "ddji", "siQsQi", OP_QDMULH_LN>;		def VQDMULH_LANEQ : SOpInst<"vqdmulh_laneq", "ddji", "siQsQi", OP_QDMULH_LN>;
def VQRDMULH_LANEQ : SOpInst<"vqrdmulh_laneq", "ddji", "siQsQi", OP_QRDMULH_LN>;		def VQRDMULH_LANEQ : SOpInst<"vqrdmulh_laneq", "ddji", "siQsQi", OP_QRDMULH_LN>;

		let ArchGuard = "defined(__ARM_FEATURE_QRDMX) && defined(__aarch64__)" in {
		def VQRDMLAH_LANEQ : SOpInst<"vqrdmlah_laneq", "dddji", "siQsQi", OP_QRDMLAH_LN>;
		def VQRDMLSH_LANEQ : SOpInst<"vqrdmlsh_laneq", "dddji", "siQsQi", OP_QRDMLSH_LN>;
		}

// Note: d type implemented by SCALAR_VMULX_LANE		// Note: d type implemented by SCALAR_VMULX_LANE
def VMULX_LANE : IOpInst<"vmulx_lane", "ddgi", "fQfQd", OP_MULX_LN>;		def VMULX_LANE : IOpInst<"vmulx_lane", "ddgi", "fQfQd", OP_MULX_LN>;
// Note: d type is implemented by SCALAR_VMULX_LANEQ		// Note: d type is implemented by SCALAR_VMULX_LANEQ
def VMULX_LANEQ : IOpInst<"vmulx_laneq", "ddji", "fQfQd", OP_MULX_LN>;		def VMULX_LANEQ : IOpInst<"vmulx_laneq", "ddji", "fQfQd", OP_MULX_LN>;

////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
// Across vectors class		// Across vectors class
def VADDLV : SInst<"vaddlv", "rd", "csiUcUsUiQcQsQiQUcQUsQUi">;		def VADDLV : SInst<"vaddlv", "rd", "csiUcUsUiQcQsQiQUcQUsQUi">;
▲ Show 20 Lines • Show All 229 Lines • ▼ Show 20 Lines
////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
// Scalar Integer Saturating Doubling Multiply Half High		// Scalar Integer Saturating Doubling Multiply Half High
def SCALAR_SQDMULH : SInst<"vqdmulh", "sss", "SsSi">;		def SCALAR_SQDMULH : SInst<"vqdmulh", "sss", "SsSi">;

////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
// Scalar Integer Saturating Rounding Doubling Multiply Half High		// Scalar Integer Saturating Rounding Doubling Multiply Half High
def SCALAR_SQRDMULH : SInst<"vqrdmulh", "sss", "SsSi">;		def SCALAR_SQRDMULH : SInst<"vqrdmulh", "sss", "SsSi">;

		let ArchGuard = "defined(__ARM_FEATURE_QRDMX) && defined(__aarch64__)" in {
		////////////////////////////////////////////////////////////////////////////////
		// Signed Saturating Rounding Doubling Multiply Accumulate Returning High Half
		def SCALAR_SQRDMLAH : SOpInst<"vqrdmlah", "ssss", "SsSi", OP_QRDMLAH>;

		////////////////////////////////////////////////////////////////////////////////
		// Signed Saturating Rounding Doubling Multiply Subtract Returning High Half
		def SCALAR_SQRDMLSH : SOpInst<"vqrdmlsh", "ssss", "SsSi", OP_QRDMLSH>;
		}

////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
// Scalar Floating-point Multiply Extended		// Scalar Floating-point Multiply Extended
def SCALAR_FMULX : IInst<"vmulx", "sss", "SfSd">;		def SCALAR_FMULX : IInst<"vmulx", "sss", "SfSd">;

////////////////////////////////////////////////////////////////////////////////		////////////////////////////////////////////////////////////////////////////////
// Scalar Floating-point Reciprocal Step		// Scalar Floating-point Reciprocal Step
def SCALAR_FRECPS : IInst<"vrecps", "sss", "SfSd">;		def SCALAR_FRECPS : IInst<"vrecps", "sss", "SfSd">;

▲ Show 20 Lines • Show All 185 Lines • ▼ Show 20 Lines
// Scalar Integer Saturating Doubling Multiply Half High (scalar by element)		// Scalar Integer Saturating Doubling Multiply Half High (scalar by element)
def SCALAR_SQDMULH_LANE : SOpInst<"vqdmulh_lane", "ssdi", "SsSi", OP_SCALAR_QDMULH_LN>;		def SCALAR_SQDMULH_LANE : SOpInst<"vqdmulh_lane", "ssdi", "SsSi", OP_SCALAR_QDMULH_LN>;
def SCALAR_SQDMULH_LANEQ : SOpInst<"vqdmulh_laneq", "ssji", "SsSi", OP_SCALAR_QDMULH_LN>;		def SCALAR_SQDMULH_LANEQ : SOpInst<"vqdmulh_laneq", "ssji", "SsSi", OP_SCALAR_QDMULH_LN>;

// Scalar Integer Saturating Rounding Doubling Multiply Half High		// Scalar Integer Saturating Rounding Doubling Multiply Half High
def SCALAR_SQRDMULH_LANE : SOpInst<"vqrdmulh_lane", "ssdi", "SsSi", OP_SCALAR_QRDMULH_LN>;		def SCALAR_SQRDMULH_LANE : SOpInst<"vqrdmulh_lane", "ssdi", "SsSi", OP_SCALAR_QRDMULH_LN>;
def SCALAR_SQRDMULH_LANEQ : SOpInst<"vqrdmulh_laneq", "ssji", "SsSi", OP_SCALAR_QRDMULH_LN>;		def SCALAR_SQRDMULH_LANEQ : SOpInst<"vqrdmulh_laneq", "ssji", "SsSi", OP_SCALAR_QRDMULH_LN>;

		let ArchGuard = "defined(__ARM_FEATURE_QRDMX) && defined(__aarch64__)" in {
		// Signed Saturating Rounding Doubling Multiply Accumulate Returning High Half
		def SCALAR_SQRDMLAH_LANE : SOpInst<"vqrdmlah_lane", "sssdi", "SsSi", OP_SCALAR_QRDMLAH_LN>;
		def SCALAR_SQRDMLAH_LANEQ : SOpInst<"vqrdmlah_laneq", "sssji", "SsSi", OP_SCALAR_QRDMLAH_LN>;

		// Signed Saturating Rounding Doubling Multiply Subtract Returning High Half
		def SCALAR_SQRDMLSH_LANE : SOpInst<"vqrdmlsh_lane", "sssdi", "SsSi", OP_SCALAR_QRDMLSH_LN>;
		def SCALAR_SQRDMLSH_LANEQ : SOpInst<"vqrdmlsh_laneq", "sssji", "SsSi", OP_SCALAR_QRDMLSH_LN>;
		}

def SCALAR_VDUP_LANE : IInst<"vdup_lane", "sdi", "ScSsSiSlSfSdSUcSUsSUiSUlSPcSPs">;		def SCALAR_VDUP_LANE : IInst<"vdup_lane", "sdi", "ScSsSiSlSfSdSUcSUsSUiSUlSPcSPs">;
def SCALAR_VDUP_LANEQ : IInst<"vdup_laneq", "sji", "ScSsSiSlSfSdSUcSUsSUiSUlSPcSPs">;		def SCALAR_VDUP_LANEQ : IInst<"vdup_laneq", "sji", "ScSsSiSlSfSdSUcSUsSUiSUlSPcSPs">;
}		}

cfe/trunk/lib/Basic/Targets.cpp

Show First 20 Lines • Show All 4,863 Lines • ▼ Show 20 Lines	void getTargetDefines(const LangOptions &Opts,
}		}

// ACLE 6.4.6 Q (saturation) flag		// ACLE 6.4.6 Q (saturation) flag
if (DSP \|\| SAT)		if (DSP \|\| SAT)
Builder.defineMacro("__ARM_FEATURE_QBIT", "1");		Builder.defineMacro("__ARM_FEATURE_QBIT", "1");

if (Opts.UnsafeFPMath)		if (Opts.UnsafeFPMath)
Builder.defineMacro("__ARM_FP_FAST", "1");		Builder.defineMacro("__ARM_FP_FAST", "1");

		if (ArchKind == llvm::ARM::AK_ARMV8_1A)
		Builder.defineMacro("__ARM_FEATURE_QRDMX", "1");
}		}

ArrayRef<Builtin::Info> getTargetBuiltins() const override {		ArrayRef<Builtin::Info> getTargetBuiltins() const override {
return llvm::makeArrayRef(BuiltinInfo,		return llvm::makeArrayRef(BuiltinInfo,
clang::ARM::LastTSBuiltin-Builtin::FirstTSBuiltin);		clang::ARM::LastTSBuiltin-Builtin::FirstTSBuiltin);
}		}
bool isCLZForZeroUndef() const override { return false; }		bool isCLZForZeroUndef() const override { return false; }
BuiltinVaListKind getBuiltinVaListKind() const override {		BuiltinVaListKind getBuiltinVaListKind() const override {
▲ Show 20 Lines • Show All 365 Lines • ▼ Show 20 Lines	enum FPUModeEnum {
FPUMode,		FPUMode,
NeonMode		NeonMode
};		};

unsigned FPU;		unsigned FPU;
unsigned CRC;		unsigned CRC;
unsigned Crypto;		unsigned Crypto;
unsigned Unaligned;		unsigned Unaligned;
		unsigned V8_1A;

static const Builtin::Info BuiltinInfo[];		static const Builtin::Info BuiltinInfo[];

std::string ABI;		std::string ABI;

public:		public:
AArch64TargetInfo(const llvm::Triple &Triple)		AArch64TargetInfo(const llvm::Triple &Triple)
: TargetInfo(Triple), ABI("aapcs") {		: TargetInfo(Triple), ABI("aapcs") {
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines	if (CRC)
Builder.defineMacro("__ARM_FEATURE_CRC32", "1");		Builder.defineMacro("__ARM_FEATURE_CRC32", "1");

if (Crypto)		if (Crypto)
Builder.defineMacro("__ARM_FEATURE_CRYPTO", "1");		Builder.defineMacro("__ARM_FEATURE_CRYPTO", "1");

if (Unaligned)		if (Unaligned)
Builder.defineMacro("__ARM_FEATURE_UNALIGNED", "1");		Builder.defineMacro("__ARM_FEATURE_UNALIGNED", "1");

		if (V8_1A)
		Builder.defineMacro("__ARM_FEATURE_QRDMX", "1");

// All of the __sync_(bool\|val)_compare_and_swap_(1\|2\|4\|8) builtins work.		// All of the __sync_(bool\|val)_compare_and_swap_(1\|2\|4\|8) builtins work.
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_1");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_1");
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_2");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_2");
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_4");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_4");
Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_8");		Builder.defineMacro("__GCC_HAVE_SYNC_COMPARE_AND_SWAP_8");
}		}

ArrayRef<Builtin::Info> getTargetBuiltins() const override {		ArrayRef<Builtin::Info> getTargetBuiltins() const override {
Show All 9 Lines	public:
}		}

bool handleTargetFeatures(std::vector<std::string> &Features,		bool handleTargetFeatures(std::vector<std::string> &Features,
DiagnosticsEngine &Diags) override {		DiagnosticsEngine &Diags) override {
FPU = FPUMode;		FPU = FPUMode;
CRC = 0;		CRC = 0;
Crypto = 0;		Crypto = 0;
Unaligned = 1;		Unaligned = 1;
		V8_1A = 0;

for (const auto &Feature : Features) {		for (const auto &Feature : Features) {
if (Feature == "+neon")		if (Feature == "+neon")
FPU = NeonMode;		FPU = NeonMode;
if (Feature == "+crc")		if (Feature == "+crc")
CRC = 1;		CRC = 1;
if (Feature == "+crypto")		if (Feature == "+crypto")
Crypto = 1;		Crypto = 1;
if (Feature == "+strict-align")		if (Feature == "+strict-align")
Unaligned = 0;		Unaligned = 0;
		if (Feature == "+v8.1a")
		V8_1A = 1;
}		}

setDataLayoutString();		setDataLayoutString();

return true;		return true;
}		}

bool isCLZForZeroUndef() const override { return false; }		bool isCLZForZeroUndef() const override { return false; }
▲ Show 20 Lines • Show All 2,492 Lines • Show Last 20 Lines

cfe/trunk/test/Preprocessor/aarch64-target-features.c

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	// RUN: %clang -target arm64-none-linux-gnu -fshort-enums -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-SHORTENUMS %s			// RUN: %clang -target arm64-none-linux-gnu -fshort-enums -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-SHORTENUMS %s
	// CHECK-SHORTENUMS: __ARM_SIZEOF_MINIMAL_ENUM 1			// CHECK-SHORTENUMS: __ARM_SIZEOF_MINIMAL_ENUM 1

	// RUN: %clang -target aarch64-none-linux-gnu -march=armv8-a+simd -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-NEON %s			// RUN: %clang -target aarch64-none-linux-gnu -march=armv8-a+simd -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-NEON %s
	// RUN: %clang -target arm64-none-linux-gnu -march=armv8-a+simd -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-NEON %s			// RUN: %clang -target arm64-none-linux-gnu -march=armv8-a+simd -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-NEON %s
	// CHECK-NEON: __ARM_NEON 1			// CHECK-NEON: __ARM_NEON 1
	// CHECK-NEON: __ARM_NEON_FP 0xE			// CHECK-NEON: __ARM_NEON_FP 0xE

				// RUN: %clang -target aarch64-none-eabi -march=armv8.1-a -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-V81A %s
				// CHECK-V81A: __ARM_FEATURE_QRDMX 1

	// RUN: %clang -target aarch64 -march=arm64 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-ARCH-NOT-ACCEPT %s			// RUN: %clang -target aarch64 -march=arm64 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-ARCH-NOT-ACCEPT %s
	// RUN: %clang -target aarch64 -march=aarch64 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-ARCH-NOT-ACCEPT %s			// RUN: %clang -target aarch64 -march=aarch64 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-ARCH-NOT-ACCEPT %s
	// CHECK-ARCH-NOT-ACCEPT: error: the clang compiler does not support			// CHECK-ARCH-NOT-ACCEPT: error: the clang compiler does not support

	// RUN: %clang -target aarch64 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-GENERIC %s			// RUN: %clang -target aarch64 -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-GENERIC %s
	// RUN: %clang -target aarch64 -march=armv8-a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-GENERIC %s			// RUN: %clang -target aarch64 -march=armv8-a -### -c %s 2>&1 \| FileCheck -check-prefix=CHECK-GENERIC %s
	// CHECK-GENERIC: "-cc1"{{.}} "-triple" "aarch64{{.}}" "-target-feature" "+neon"			// CHECK-GENERIC: "-cc1"{{.}} "-triple" "aarch64{{.}}" "-target-feature" "+neon"

	▲ Show 20 Lines • Show All 69 Lines • Show Last 20 Lines

cfe/trunk/test/Preprocessor/arm-target-features.c

	Show First 20 Lines • Show All 401 Lines • ▼ Show 20 Lines
	// KRAIT-THUMB:#define __ARM_ARCH_EXT_IDIV__ 1			// KRAIT-THUMB:#define __ARM_ARCH_EXT_IDIV__ 1
	// KRAIT-THUMB:#define __ARM_FEATURE_DSP			// KRAIT-THUMB:#define __ARM_FEATURE_DSP
	// KRAIT-THUMB:#define __ARM_VFPV4__ 1			// KRAIT-THUMB:#define __ARM_VFPV4__ 1

	// RUN: %clang -target armv8.1a-none-none-eabi -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-V81A %s			// RUN: %clang -target armv8.1a-none-none-eabi -x c -E -dM %s -o - \| FileCheck --check-prefix=CHECK-V81A %s
	// CHECK-V81A: __ARM_ARCH 8			// CHECK-V81A: __ARM_ARCH 8
	// CHECK-V81A: __ARM_ARCH_8_1A__ 1			// CHECK-V81A: __ARM_ARCH_8_1A__ 1
	// CHECK-V81A: #define __ARM_ARCH_PROFILE 'A'			// CHECK-V81A: #define __ARM_ARCH_PROFILE 'A'
				// CHECK-V81A: __ARM_FEATURE_QRDMX 1
	// CHECK-V81A: #define __ARM_FP 0xE			// CHECK-V81A: #define __ARM_FP 0xE