aboutsummaryrefslogtreecommitdiffhomepage
diff options
context:
space:
mode:
-rw-r--r--ptx/src/ast.rs67
-rw-r--r--ptx/src/ptx.lalrpop42
-rw-r--r--ptx/src/test/spirv_run/add.spvtxt43
-rw-r--r--ptx/src/test/spirv_run/and.spvtxt124
-rw-r--r--ptx/src/test/spirv_run/atom_add.spvtxt160
-rw-r--r--ptx/src/test/spirv_run/atom_cas.spvtxt146
-rw-r--r--ptx/src/test/spirv_run/b64tof64.spvtxt46
-rw-r--r--ptx/src/test/spirv_run/block.spvtxt49
-rw-r--r--ptx/src/test/spirv_run/bra.spvtxt49
-rw-r--r--ptx/src/test/spirv_run/call.spvtxt86
-rw-r--r--ptx/src/test/spirv_run/constant_f32.spvtxt105
-rw-r--r--ptx/src/test/spirv_run/constant_negative.spvtxt104
-rw-r--r--ptx/src/test/spirv_run/cos.ptx21
-rw-r--r--ptx/src/test/spirv_run/cos.spvtxt47
-rw-r--r--ptx/src/test/spirv_run/cvt_sat_s_u.spvtxt49
-rw-r--r--ptx/src/test/spirv_run/cvta.spvtxt51
-rw-r--r--ptx/src/test/spirv_run/div_approx.spvtxt121
-rw-r--r--ptx/src/test/spirv_run/ex2.ptx21
-rw-r--r--ptx/src/test/spirv_run/ex2.spvtxt47
-rw-r--r--ptx/src/test/spirv_run/extern_shared.spvtxt62
-rw-r--r--ptx/src/test/spirv_run/fma.spvtxt135
-rw-r--r--ptx/src/test/spirv_run/global_array.spvtxt37
-rw-r--r--ptx/src/test/spirv_run/implicit_param.spvtxt48
-rw-r--r--ptx/src/test/spirv_run/ld_st.spvtxt37
-rw-r--r--ptx/src/test/spirv_run/ld_st_implicit.spvtxt42
-rw-r--r--ptx/src/test/spirv_run/ld_st_offset.spvtxt53
-rw-r--r--ptx/src/test/spirv_run/lg2.ptx21
-rw-r--r--ptx/src/test/spirv_run/lg2.spvtxt47
-rw-r--r--ptx/src/test/spirv_run/local_align.spvtxt39
-rw-r--r--ptx/src/test/spirv_run/mad_s32.spvtxt76
-rw-r--r--ptx/src/test/spirv_run/max.spvtxt48
-rw-r--r--ptx/src/test/spirv_run/min.spvtxt48
-rw-r--r--ptx/src/test/spirv_run/mod.rs7
-rw-r--r--ptx/src/test/spirv_run/mov.spvtxt43
-rw-r--r--ptx/src/test/spirv_run/mul_hi.spvtxt43
-rw-r--r--ptx/src/test/spirv_run/mul_lo.spvtxt43
-rw-r--r--ptx/src/test/spirv_run/mul_non_ftz.spvtxt52
-rw-r--r--ptx/src/test/spirv_run/mul_wide.spvtxt60
-rw-r--r--ptx/src/test/spirv_run/neg.spvtxt62
-rw-r--r--ptx/src/test/spirv_run/not.spvtxt47
-rw-r--r--ptx/src/test/spirv_run/ntid.spvtxt52
-rw-r--r--ptx/src/test/spirv_run/or.spvtxt54
-rw-r--r--ptx/src/test/spirv_run/pred_not.spvtxt74
-rw-r--r--ptx/src/test/spirv_run/rcp.spvtxt38
-rw-r--r--ptx/src/test/spirv_run/reg_local.ptx5
-rw-r--r--ptx/src/test/spirv_run/reg_local.spvtxt76
-rw-r--r--ptx/src/test/spirv_run/rsqrt.spvtxt103
-rw-r--r--ptx/src/test/spirv_run/selp.spvtxt122
-rw-r--r--ptx/src/test/spirv_run/setp.spvtxt69
-rw-r--r--ptx/src/test/spirv_run/shared_ptr_32.spvtxt140
-rw-r--r--ptx/src/test/spirv_run/shared_variable.spvtxt122
-rw-r--r--ptx/src/test/spirv_run/shl.spvtxt47
-rw-r--r--ptx/src/test/spirv_run/shr.spvtxt34
-rw-r--r--ptx/src/test/spirv_run/sin.ptx21
-rw-r--r--ptx/src/test/spirv_run/sin.spvtxt47
-rw-r--r--ptx/src/test/spirv_run/sqrt.spvtxt103
-rw-r--r--ptx/src/test/spirv_run/sub.spvtxt38
-rw-r--r--ptx/src/test/spirv_run/vector.spvtxt52
-rw-r--r--ptx/src/test/spirv_run/vector_extract.spvtxt156
-rw-r--r--ptx/src/translate.rs1110
60 files changed, 2721 insertions, 2170 deletions
diff --git a/ptx/src/ast.rs b/ptx/src/ast.rs
index 7f2fc9a..653060b 100644
--- a/ptx/src/ast.rs
+++ b/ptx/src/ast.rs
@@ -113,6 +113,8 @@ sub_type! {
VariableRegType {
Scalar(ScalarType),
Vector(SizedScalarType, u8),
+ // Array type is used when emiting SSA statements at the start of a method
+ Array(ScalarType, VecU32),
// Pointer variant is used when passing around SLM pointer between
// function calls for dynamic SLM
Pointer(SizedScalarType, PointerStateSpace)
@@ -267,7 +269,6 @@ pub enum MethodDecl<'a, ID> {
Kernel {
name: &'a str,
in_args: Vec<KernelArgument<ID>>,
- uses_shared_mem: bool,
},
}
@@ -293,16 +294,51 @@ pub enum KernelArgumentType {
Shared,
}
-impl From<FnArgumentType> for Type {
- fn from(t: FnArgumentType) -> Self {
- match t {
- FnArgumentType::Reg(x) => x.into(),
- FnArgumentType::Param(x) => x.into(),
+impl FnArgumentType {
+ pub fn to_type(&self, is_kernel: bool) -> Type {
+ if is_kernel {
+ self.to_kernel_type()
+ } else {
+ self.to_func_type()
+ }
+ }
+
+ pub fn to_kernel_type(&self) -> Type {
+ match self {
+ FnArgumentType::Reg(x) => x.clone().into(),
+ FnArgumentType::Param(x) => x.clone().into(),
+ FnArgumentType::Shared => {
+ Type::Pointer(PointerType::Scalar(ScalarType::B8), LdStateSpace::Shared)
+ }
+ }
+ }
+
+ pub fn to_func_type(&self) -> Type {
+ match self {
+ FnArgumentType::Reg(x) => x.clone().into(),
+ FnArgumentType::Param(VariableParamType::Scalar(t)) => {
+ Type::Pointer(PointerType::Scalar((*t).into()), LdStateSpace::Param)
+ }
+ FnArgumentType::Param(VariableParamType::Array(t, dims)) => Type::Pointer(
+ PointerType::Array((*t).into(), dims.clone()),
+ LdStateSpace::Param,
+ ),
+ FnArgumentType::Param(VariableParamType::Pointer(t, space)) => Type::Pointer(
+ PointerType::Pointer((*t).into(), (*space).into()),
+ LdStateSpace::Param,
+ ),
FnArgumentType::Shared => {
Type::Pointer(PointerType::Scalar(ScalarType::B8), LdStateSpace::Shared)
}
}
}
+
+ pub fn is_param(&self) -> bool {
+ match self {
+ FnArgumentType::Param(_) => true,
+ _ => false,
+ }
+ }
}
sub_enum!(
@@ -323,11 +359,12 @@ pub enum Type {
Pointer(PointerType, LdStateSpace),
}
-sub_type! {
- PointerType {
- Scalar(ScalarType),
- Vector(ScalarType, u8),
- }
+#[derive(PartialEq, Eq, Clone)]
+pub enum PointerType {
+ Scalar(ScalarType),
+ Vector(ScalarType, u8),
+ Array(ScalarType, VecU32),
+ Pointer(ScalarType, LdStateSpace),
}
impl From<SizedScalarType> for PointerType {
@@ -343,6 +380,8 @@ impl TryFrom<PointerType> for SizedScalarType {
match value {
PointerType::Scalar(t) => Ok(t.try_into()?),
PointerType::Vector(_, _) => Err(()),
+ PointerType::Array(_, _) => Err(()),
+ PointerType::Pointer(_, _) => Err(()),
}
}
}
@@ -456,6 +495,7 @@ pub struct MultiVariable<ID> {
pub count: Option<u32>,
}
+#[derive(Clone)]
pub struct Variable<T, ID> {
pub align: Option<u32>,
pub v_type: T,
@@ -543,6 +583,10 @@ pub enum Instruction<P: ArgParams> {
Sqrt(SqrtDetails, Arg2<P>),
Rsqrt(RsqrtDetails, Arg2<P>),
Neg(NegDetails, Arg2<P>),
+ Sin { flush_to_zero: bool, arg: Arg2<P> },
+ Cos { flush_to_zero: bool, arg: Arg2<P> },
+ Lg2 { flush_to_zero: bool, arg: Arg2<P> },
+ Ex2 { flush_to_zero: bool, arg: Arg2<P> },
}
#[derive(Copy, Clone)]
@@ -744,6 +788,7 @@ pub enum MemScope {
}
#[derive(Copy, Clone, PartialEq, Eq, Debug)]
+#[repr(u8)]
pub enum LdStateSpace {
Generic,
Const,
diff --git a/ptx/src/ptx.lalrpop b/ptx/src/ptx.lalrpop
index 9d2adec..584ef84 100644
--- a/ptx/src/ptx.lalrpop
+++ b/ptx/src/ptx.lalrpop
@@ -144,12 +144,15 @@ match {
"barrier",
"bra",
"call",
+ "cos",
"cvt",
"cvta",
"debug",
"div",
+ "ex2",
"fma",
"ld",
+ "lg2",
"mad",
"map_f64_to_f32",
"max",
@@ -166,6 +169,7 @@ match {
"setp",
"shl",
"shr",
+ "sin",
r"sm_[0-9]+" => ShaderModel,
"sqrt",
"st",
@@ -187,12 +191,15 @@ ExtendedID : &'input str = {
"barrier",
"bra",
"call",
+ "cos",
"cvt",
"cvta",
"debug",
"div",
+ "ex2",
"fma",
"ld",
+ "lg2",
"mad",
"map_f64_to_f32",
"max",
@@ -209,6 +216,7 @@ ExtendedID : &'input str = {
"setp",
"shl",
"shr",
+ "sin",
ShaderModel,
"sqrt",
"st",
@@ -346,7 +354,7 @@ LinkingDirectives: ast::LinkingDirective = {
MethodDecl: ast::MethodDecl<'input, &'input str> = {
".entry" <name:ExtendedID> <in_args:KernelArguments> =>
- ast::MethodDecl::Kernel{ name, in_args, uses_shared_mem: false },
+ ast::MethodDecl::Kernel{ name, in_args },
".func" <ret_vals:FnArguments?> <name:ExtendedID> <params:FnArguments> => {
ast::MethodDecl::Func(ret_vals.unwrap_or_else(|| Vec::new()), name, params)
}
@@ -687,6 +695,10 @@ Instruction: ast::Instruction<ast::ParsedArgParams<'input>> = {
InstSqrt,
InstRsqrt,
InstNeg,
+ InstSin,
+ InstCos,
+ InstLg2,
+ InstEx2,
};
// https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#data-movement-and-conversion-instructions-ld
@@ -1600,6 +1612,34 @@ InstNeg: ast::Instruction<ast::ParsedArgParams<'input>> = {
},
}
+// https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#floating-point-instructions-sin
+InstSin: ast::Instruction<ast::ParsedArgParams<'input>> = {
+ "sin" ".approx" <ftz:".ftz"?> ".f32" <arg:Arg2> => {
+ ast::Instruction::Sin{ flush_to_zero: ftz.is_some(), arg }
+ },
+}
+
+// https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#floating-point-instructions-cos
+InstCos: ast::Instruction<ast::ParsedArgParams<'input>> = {
+ "cos" ".approx" <ftz:".ftz"?> ".f32" <arg:Arg2> => {
+ ast::Instruction::Cos{ flush_to_zero: ftz.is_some(), arg }
+ },
+}
+
+// https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#floating-point-instructions-lg2
+InstLg2: ast::Instruction<ast::ParsedArgParams<'input>> = {
+ "lg2" ".approx" <ftz:".ftz"?> ".f32" <arg:Arg2> => {
+ ast::Instruction::Lg2{ flush_to_zero: ftz.is_some(), arg }
+ },
+}
+
+// https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#floating-point-instructions-ex2
+InstEx2: ast::Instruction<ast::ParsedArgParams<'input>> = {
+ "ex2" ".approx" <ftz:".ftz"?> ".f32" <arg:Arg2> => {
+ ast::Instruction::Ex2{ flush_to_zero: ftz.is_some(), arg }
+ },
+}
+
NegTypeFtz: ast::ScalarType = {
".f16" => ast::ScalarType::F16,
".f16x2" => ast::ScalarType::F16x2,
diff --git a/ptx/src/test/spirv_run/add.spvtxt b/ptx/src/test/spirv_run/add.spvtxt
index 6810fec..d9a5b9e 100644
--- a/ptx/src/test/spirv_run/add.spvtxt
+++ b/ptx/src/test/spirv_run/add.spvtxt
@@ -2,21 +2,24 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %25 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %23 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "add"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %28 = OpTypeFunction %void %ulong %ulong
+ %26 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_1 = OpConstant %ulong 1
- %1 = OpFunction %void None %28
+ %1 = OpFunction %void None %26
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %23 = OpLabel
+ %21 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -25,22 +28,20 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %21 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %21
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %16 = OpIAdd %ulong %17 %ulong_1
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %22 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %22 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %19 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %19
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %14 = OpIAdd %ulong %15 %ulong_1
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %20 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %20 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/and.spvtxt b/ptx/src/test/spirv_run/and.spvtxt
index 8358c28..57c36e6 100644
--- a/ptx/src/test/spirv_run/and.spvtxt
+++ b/ptx/src/test/spirv_run/and.spvtxt
@@ -1,66 +1,58 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 41
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%33 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "and"
-%34 = OpTypeVoid
-%35 = OpTypeInt 64 0
-%36 = OpTypeFunction %34 %35 %35
-%37 = OpTypePointer Function %35
-%38 = OpTypeInt 32 0
-%39 = OpTypePointer Function %38
-%40 = OpTypePointer Generic %38
-%23 = OpConstant %35 4
-%1 = OpFunction %34 None %36
-%8 = OpFunctionParameter %35
-%9 = OpFunctionParameter %35
-%31 = OpLabel
-%2 = OpVariable %37 Function
-%3 = OpVariable %37 Function
-%4 = OpVariable %37 Function
-%5 = OpVariable %37 Function
-%6 = OpVariable %39 Function
-%7 = OpVariable %39 Function
-OpStore %2 %8
-OpStore %3 %9
-%11 = OpLoad %35 %2
-%10 = OpCopyObject %35 %11
-OpStore %4 %10
-%13 = OpLoad %35 %3
-%12 = OpCopyObject %35 %13
-OpStore %5 %12
-%15 = OpLoad %35 %4
-%25 = OpConvertUToPtr %40 %15
-%14 = OpLoad %38 %25
-OpStore %6 %14
-%17 = OpLoad %35 %4
-%24 = OpIAdd %35 %17 %23
-%26 = OpConvertUToPtr %40 %24
-%16 = OpLoad %38 %26
-OpStore %7 %16
-%19 = OpLoad %38 %6
-%20 = OpLoad %38 %7
-%28 = OpCopyObject %38 %19
-%29 = OpCopyObject %38 %20
-%27 = OpBitwiseAnd %38 %28 %29
-%18 = OpCopyObject %38 %27
-OpStore %6 %18
-%21 = OpLoad %35 %5
-%22 = OpLoad %38 %6
-%30 = OpConvertUToPtr %40 %21
-OpStore %30 %22
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %31 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "and"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %34 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %uint = OpTypeInt 32 0
+%_ptr_Function_uint = OpTypePointer Function %uint
+%_ptr_Generic_uint = OpTypePointer Generic %uint
+ %ulong_4 = OpConstant %ulong 4
+ %1 = OpFunction %void None %34
+ %8 = OpFunctionParameter %ulong
+ %9 = OpFunctionParameter %ulong
+ %29 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_uint Function
+ %7 = OpVariable %_ptr_Function_uint Function
+ OpStore %2 %8
+ OpStore %3 %9
+ %10 = OpLoad %ulong %2
+ OpStore %4 %10
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_uint %13
+ %12 = OpLoad %uint %23
+ OpStore %6 %12
+ %15 = OpLoad %ulong %4
+ %22 = OpIAdd %ulong %15 %ulong_4
+ %24 = OpConvertUToPtr %_ptr_Generic_uint %22
+ %14 = OpLoad %uint %24
+ OpStore %7 %14
+ %17 = OpLoad %uint %6
+ %18 = OpLoad %uint %7
+ %26 = OpCopyObject %uint %17
+ %27 = OpCopyObject %uint %18
+ %25 = OpBitwiseAnd %uint %26 %27
+ %16 = OpCopyObject %uint %25
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %uint %6
+ %28 = OpConvertUToPtr %_ptr_Generic_uint %19
+ OpStore %28 %20
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/atom_add.spvtxt b/ptx/src/test/spirv_run/atom_add.spvtxt
index 2c83fe9..6a977e0 100644
--- a/ptx/src/test/spirv_run/atom_add.spvtxt
+++ b/ptx/src/test/spirv_run/atom_add.spvtxt
@@ -1,84 +1,76 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 55
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%40 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "atom_add" %4
-OpDecorate %4 Alignment 4
-%41 = OpTypeVoid
-%42 = OpTypeInt 32 0
-%43 = OpTypeInt 8 0
-%44 = OpConstant %42 1024
-%45 = OpTypeArray %43 %44
-%46 = OpTypePointer Workgroup %45
-%4 = OpVariable %46 Workgroup
-%47 = OpTypeInt 64 0
-%48 = OpTypeFunction %41 %47 %47
-%49 = OpTypePointer Function %47
-%50 = OpTypePointer Function %42
-%51 = OpTypePointer Generic %42
-%27 = OpConstant %47 4
-%52 = OpTypePointer Workgroup %42
-%53 = OpConstant %42 1
-%54 = OpConstant %42 0
-%29 = OpConstant %47 4
-%1 = OpFunction %41 None %48
-%9 = OpFunctionParameter %47
-%10 = OpFunctionParameter %47
-%38 = OpLabel
-%2 = OpVariable %49 Function
-%3 = OpVariable %49 Function
-%5 = OpVariable %49 Function
-%6 = OpVariable %49 Function
-%7 = OpVariable %50 Function
-%8 = OpVariable %50 Function
-OpStore %2 %9
-OpStore %3 %10
-%12 = OpLoad %47 %2
-%11 = OpCopyObject %47 %12
-OpStore %5 %11
-%14 = OpLoad %47 %3
-%13 = OpCopyObject %47 %14
-OpStore %6 %13
-%16 = OpLoad %47 %5
-%31 = OpConvertUToPtr %51 %16
-%15 = OpLoad %42 %31
-OpStore %7 %15
-%18 = OpLoad %47 %5
-%28 = OpIAdd %47 %18 %27
-%32 = OpConvertUToPtr %51 %28
-%17 = OpLoad %42 %32
-OpStore %8 %17
-%19 = OpLoad %42 %7
-%33 = OpBitcast %52 %4
-OpStore %33 %19
-%21 = OpLoad %42 %8
-%34 = OpBitcast %52 %4
-%20 = OpAtomicIAdd %42 %34 %53 %54 %21
-OpStore %7 %20
-%35 = OpBitcast %52 %4
-%22 = OpLoad %42 %35
-OpStore %8 %22
-%23 = OpLoad %47 %6
-%24 = OpLoad %42 %7
-%36 = OpConvertUToPtr %51 %23
-OpStore %36 %24
-%25 = OpLoad %47 %6
-%26 = OpLoad %42 %8
-%30 = OpIAdd %47 %25 %29
-%37 = OpConvertUToPtr %51 %30
-OpStore %37 %26
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %38 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "atom_add" %4
+ OpDecorate %4 Alignment 4
+ %void = OpTypeVoid
+ %uint = OpTypeInt 32 0
+ %uchar = OpTypeInt 8 0
+ %uint_1024 = OpConstant %uint 1024
+%_arr_uchar_uint_1024 = OpTypeArray %uchar %uint_1024
+%_ptr_Workgroup__arr_uchar_uint_1024 = OpTypePointer Workgroup %_arr_uchar_uint_1024
+ %4 = OpVariable %_ptr_Workgroup__arr_uchar_uint_1024 Workgroup
+ %ulong = OpTypeInt 64 0
+ %46 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+%_ptr_Function_uint = OpTypePointer Function %uint
+%_ptr_Generic_uint = OpTypePointer Generic %uint
+ %ulong_4 = OpConstant %ulong 4
+%_ptr_Workgroup_uint = OpTypePointer Workgroup %uint
+ %uint_1 = OpConstant %uint 1
+ %uint_0 = OpConstant %uint 0
+ %ulong_4_0 = OpConstant %ulong 4
+ %1 = OpFunction %void None %46
+ %9 = OpFunctionParameter %ulong
+ %10 = OpFunctionParameter %ulong
+ %36 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_ulong Function
+ %7 = OpVariable %_ptr_Function_uint Function
+ %8 = OpVariable %_ptr_Function_uint Function
+ OpStore %2 %9
+ OpStore %3 %10
+ %11 = OpLoad %ulong %2
+ OpStore %5 %11
+ %12 = OpLoad %ulong %3
+ OpStore %6 %12
+ %14 = OpLoad %ulong %5
+ %29 = OpConvertUToPtr %_ptr_Generic_uint %14
+ %13 = OpLoad %uint %29
+ OpStore %7 %13
+ %16 = OpLoad %ulong %5
+ %26 = OpIAdd %ulong %16 %ulong_4
+ %30 = OpConvertUToPtr %_ptr_Generic_uint %26
+ %15 = OpLoad %uint %30
+ OpStore %8 %15
+ %17 = OpLoad %uint %7
+ %31 = OpBitcast %_ptr_Workgroup_uint %4
+ OpStore %31 %17
+ %19 = OpLoad %uint %8
+ %32 = OpBitcast %_ptr_Workgroup_uint %4
+ %18 = OpAtomicIAdd %uint %32 %uint_1 %uint_0 %19
+ OpStore %7 %18
+ %33 = OpBitcast %_ptr_Workgroup_uint %4
+ %20 = OpLoad %uint %33
+ OpStore %8 %20
+ %21 = OpLoad %ulong %6
+ %22 = OpLoad %uint %7
+ %34 = OpConvertUToPtr %_ptr_Generic_uint %21
+ OpStore %34 %22
+ %23 = OpLoad %ulong %6
+ %24 = OpLoad %uint %8
+ %28 = OpIAdd %ulong %23 %ulong_4_0
+ %35 = OpConvertUToPtr %_ptr_Generic_uint %28
+ OpStore %35 %24
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/atom_cas.spvtxt b/ptx/src/test/spirv_run/atom_cas.spvtxt
index c5fb922..b28d3bc 100644
--- a/ptx/src/test/spirv_run/atom_cas.spvtxt
+++ b/ptx/src/test/spirv_run/atom_cas.spvtxt
@@ -1,77 +1,69 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 51
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%41 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "atom_cas"
-%42 = OpTypeVoid
-%43 = OpTypeInt 64 0
-%44 = OpTypeFunction %42 %43 %43
-%45 = OpTypePointer Function %43
-%46 = OpTypeInt 32 0
-%47 = OpTypePointer Function %46
-%48 = OpTypePointer Generic %46
-%25 = OpConstant %43 4
-%27 = OpConstant %46 100
-%49 = OpConstant %46 1
-%50 = OpConstant %46 0
-%28 = OpConstant %43 4
-%30 = OpConstant %43 4
-%1 = OpFunction %42 None %44
-%8 = OpFunctionParameter %43
-%9 = OpFunctionParameter %43
-%39 = OpLabel
-%2 = OpVariable %45 Function
-%3 = OpVariable %45 Function
-%4 = OpVariable %45 Function
-%5 = OpVariable %45 Function
-%6 = OpVariable %47 Function
-%7 = OpVariable %47 Function
-OpStore %2 %8
-OpStore %3 %9
-%11 = OpLoad %43 %2
-%10 = OpCopyObject %43 %11
-OpStore %4 %10
-%13 = OpLoad %43 %3
-%12 = OpCopyObject %43 %13
-OpStore %5 %12
-%15 = OpLoad %43 %4
-%32 = OpConvertUToPtr %48 %15
-%14 = OpLoad %46 %32
-OpStore %6 %14
-%17 = OpLoad %43 %4
-%18 = OpLoad %46 %6
-%26 = OpIAdd %43 %17 %25
-%34 = OpConvertUToPtr %48 %26
-%35 = OpCopyObject %46 %18
-%33 = OpAtomicCompareExchange %46 %34 %49 %50 %50 %27 %35
-%16 = OpCopyObject %46 %33
-OpStore %6 %16
-%20 = OpLoad %43 %4
-%29 = OpIAdd %43 %20 %28
-%36 = OpConvertUToPtr %48 %29
-%19 = OpLoad %46 %36
-OpStore %7 %19
-%21 = OpLoad %43 %5
-%22 = OpLoad %46 %6
-%37 = OpConvertUToPtr %48 %21
-OpStore %37 %22
-%23 = OpLoad %43 %5
-%24 = OpLoad %46 %7
-%31 = OpIAdd %43 %23 %30
-%38 = OpConvertUToPtr %48 %31
-OpStore %38 %24
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %39 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "atom_cas"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %42 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %uint = OpTypeInt 32 0
+%_ptr_Function_uint = OpTypePointer Function %uint
+%_ptr_Generic_uint = OpTypePointer Generic %uint
+ %ulong_4 = OpConstant %ulong 4
+ %uint_100 = OpConstant %uint 100
+ %uint_1 = OpConstant %uint 1
+ %uint_0 = OpConstant %uint 0
+ %ulong_4_0 = OpConstant %ulong 4
+ %ulong_4_1 = OpConstant %ulong 4
+ %1 = OpFunction %void None %42
+ %8 = OpFunctionParameter %ulong
+ %9 = OpFunctionParameter %ulong
+ %37 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_uint Function
+ %7 = OpVariable %_ptr_Function_uint Function
+ OpStore %2 %8
+ OpStore %3 %9
+ %10 = OpLoad %ulong %2
+ OpStore %4 %10
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %30 = OpConvertUToPtr %_ptr_Generic_uint %13
+ %12 = OpLoad %uint %30
+ OpStore %6 %12
+ %15 = OpLoad %ulong %4
+ %16 = OpLoad %uint %6
+ %24 = OpIAdd %ulong %15 %ulong_4
+ %32 = OpConvertUToPtr %_ptr_Generic_uint %24
+ %33 = OpCopyObject %uint %16
+ %31 = OpAtomicCompareExchange %uint %32 %uint_1 %uint_0 %uint_0 %uint_100 %33
+ %14 = OpCopyObject %uint %31
+ OpStore %6 %14
+ %18 = OpLoad %ulong %4
+ %27 = OpIAdd %ulong %18 %ulong_4_0
+ %34 = OpConvertUToPtr %_ptr_Generic_uint %27
+ %17 = OpLoad %uint %34
+ OpStore %7 %17
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %uint %6
+ %35 = OpConvertUToPtr %_ptr_Generic_uint %19
+ OpStore %35 %20
+ %21 = OpLoad %ulong %5
+ %22 = OpLoad %uint %7
+ %29 = OpIAdd %ulong %21 %ulong_4_1
+ %36 = OpConvertUToPtr %_ptr_Generic_uint %29
+ OpStore %36 %22
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/b64tof64.spvtxt b/ptx/src/test/spirv_run/b64tof64.spvtxt
index 9146c90..e8cfcf4 100644
--- a/ptx/src/test/spirv_run/b64tof64.spvtxt
+++ b/ptx/src/test/spirv_run/b64tof64.spvtxt
@@ -2,23 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
OpCapability Float64
- %26 = OpExtInstImport "OpenCL.std"
+ %24 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "b64tof64"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %29 = OpTypeFunction %void %ulong %ulong
+ %27 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%double = OpTypeFloat 64
%_ptr_Function_double = OpTypePointer Function %double
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %29
+ %1 = OpFunction %void None %27
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %24 = OpLabel
+ %22 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_double Function
@@ -27,24 +29,22 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %20 = OpBitcast %double %11
- %10 = OpCopyObject %double %20
+ %18 = OpBitcast %_ptr_Function_double %2
+ %10 = OpLoad %double %18
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %6 %12
- %15 = OpLoad %double %4
- %21 = OpBitcast %ulong %15
- %14 = OpCopyObject %ulong %21
- OpStore %5 %14
- %17 = OpLoad %ulong %5
- %22 = OpConvertUToPtr %_ptr_Generic_ulong %17
- %16 = OpLoad %ulong %22
- OpStore %7 %16
- %18 = OpLoad %ulong %6
- %19 = OpLoad %ulong %7
- %23 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %23 %19
+ %11 = OpLoad %ulong %3
+ OpStore %6 %11
+ %13 = OpLoad %double %4
+ %19 = OpBitcast %ulong %13
+ %12 = OpCopyObject %ulong %19
+ OpStore %5 %12
+ %15 = OpLoad %ulong %5
+ %20 = OpConvertUToPtr %_ptr_Generic_ulong %15
+ %14 = OpLoad %ulong %20
+ OpStore %7 %14
+ %16 = OpLoad %ulong %6
+ %17 = OpLoad %ulong %7
+ %21 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %21 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/block.spvtxt b/ptx/src/test/spirv_run/block.spvtxt
index 534167d..fe7e63a 100644
--- a/ptx/src/test/spirv_run/block.spvtxt
+++ b/ptx/src/test/spirv_run/block.spvtxt
@@ -2,22 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %29 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %27 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "block"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %32 = OpTypeFunction %void %ulong %ulong
+ %30 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_1 = OpConstant %ulong 1
%ulong_1_0 = OpConstant %ulong 1
- %1 = OpFunction %void None %32
+ %1 = OpFunction %void None %30
%9 = OpFunctionParameter %ulong
%10 = OpFunctionParameter %ulong
- %27 = OpLabel
+ %25 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -27,25 +30,23 @@
%8 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %9
OpStore %3 %10
- %12 = OpLoad %ulong %2
- %11 = OpCopyObject %ulong %12
+ %11 = OpLoad %ulong %2
OpStore %4 %11
- %14 = OpLoad %ulong %3
- %13 = OpCopyObject %ulong %14
- OpStore %5 %13
- %16 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_Generic_ulong %16
- %15 = OpLoad %ulong %25
- OpStore %6 %15
- %18 = OpLoad %ulong %6
- %17 = OpIAdd %ulong %18 %ulong_1
- OpStore %7 %17
- %20 = OpLoad %ulong %8
- %19 = OpIAdd %ulong %20 %ulong_1_0
- OpStore %8 %19
- %21 = OpLoad %ulong %5
- %22 = OpLoad %ulong %7
- %26 = OpConvertUToPtr %_ptr_Generic_ulong %21
- OpStore %26 %22
+ %12 = OpLoad %ulong %3
+ OpStore %5 %12
+ %14 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_ulong %14
+ %13 = OpLoad %ulong %23
+ OpStore %6 %13
+ %16 = OpLoad %ulong %6
+ %15 = OpIAdd %ulong %16 %ulong_1
+ OpStore %7 %15
+ %18 = OpLoad %ulong %8
+ %17 = OpIAdd %ulong %18 %ulong_1_0
+ OpStore %8 %17
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %ulong %7
+ %24 = OpConvertUToPtr %_ptr_Generic_ulong %19
+ OpStore %24 %20
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/bra.spvtxt b/ptx/src/test/spirv_run/bra.spvtxt
index f59fda5..b20e61a 100644
--- a/ptx/src/test/spirv_run/bra.spvtxt
+++ b/ptx/src/test/spirv_run/bra.spvtxt
@@ -2,22 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %31 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %29 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "bra"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %34 = OpTypeFunction %void %ulong %ulong
+ %32 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_1 = OpConstant %ulong 1
%ulong_2 = OpConstant %ulong 2
- %1 = OpFunction %void None %34
+ %1 = OpFunction %void None %32
%11 = OpFunctionParameter %ulong
%12 = OpFunctionParameter %ulong
- %29 = OpLabel
+ %27 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%7 = OpVariable %_ptr_Function_ulong Function
@@ -26,31 +29,29 @@
%10 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %11
OpStore %3 %12
- %14 = OpLoad %ulong %2
- %13 = OpCopyObject %ulong %14
+ %13 = OpLoad %ulong %2
OpStore %7 %13
- %16 = OpLoad %ulong %3
- %15 = OpCopyObject %ulong %16
- OpStore %8 %15
- %18 = OpLoad %ulong %7
- %27 = OpConvertUToPtr %_ptr_Generic_ulong %18
- %17 = OpLoad %ulong %27
- OpStore %9 %17
+ %14 = OpLoad %ulong %3
+ OpStore %8 %14
+ %16 = OpLoad %ulong %7
+ %25 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ %15 = OpLoad %ulong %25
+ OpStore %9 %15
OpBranch %4
%4 = OpLabel
+ %18 = OpLoad %ulong %9
+ %17 = OpIAdd %ulong %18 %ulong_1
+ OpStore %10 %17
+ OpBranch %6
+ %35 = OpLabel
%20 = OpLoad %ulong %9
- %19 = OpIAdd %ulong %20 %ulong_1
+ %19 = OpIAdd %ulong %20 %ulong_2
OpStore %10 %19
OpBranch %6
- %37 = OpLabel
- %22 = OpLoad %ulong %9
- %21 = OpIAdd %ulong %22 %ulong_2
- OpStore %10 %21
- OpBranch %6
%6 = OpLabel
- %23 = OpLoad %ulong %8
- %24 = OpLoad %ulong %10
- %28 = OpConvertUToPtr %_ptr_Generic_ulong %23
- OpStore %28 %24
+ %21 = OpLoad %ulong %8
+ %22 = OpLoad %ulong %10
+ %26 = OpConvertUToPtr %_ptr_Generic_ulong %21
+ OpStore %26 %22
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/call.spvtxt b/ptx/src/test/spirv_run/call.spvtxt
index ca4685a..31f5307 100644
--- a/ptx/src/test/spirv_run/call.spvtxt
+++ b/ptx/src/test/spirv_run/call.spvtxt
@@ -2,22 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %47 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %37 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %4 "call"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %50 = OpTypeFunction %void %ulong %ulong
+ %40 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_CrossWorkgroup_ulong = OpTypePointer CrossWorkgroup %ulong
- %53 = OpTypeFunction %ulong %ulong
+ %44 = OpTypeFunction %void %_ptr_Function_ulong %_ptr_Function_ulong
%ulong_1 = OpConstant %ulong 1
- %4 = OpFunction %void None %50
+ %4 = OpFunction %void None %40
%12 = OpFunctionParameter %ulong
%13 = OpFunctionParameter %ulong
- %32 = OpLabel
+ %26 = OpLabel
%5 = OpVariable %_ptr_Function_ulong Function
%6 = OpVariable %_ptr_Function_ulong Function
%7 = OpVariable %_ptr_Function_ulong Function
@@ -27,49 +30,38 @@
%11 = OpVariable %_ptr_Function_ulong Function
OpStore %5 %12
OpStore %6 %13
- %15 = OpLoad %ulong %5
- %14 = OpCopyObject %ulong %15
+ %14 = OpLoad %ulong %5
OpStore %7 %14
- %17 = OpLoad %ulong %6
- %16 = OpCopyObject %ulong %17
- OpStore %8 %16
- %19 = OpLoad %ulong %7
- %28 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %19
- %18 = OpLoad %ulong %28
- OpStore %9 %18
+ %15 = OpLoad %ulong %6
+ OpStore %8 %15
+ %17 = OpLoad %ulong %7
+ %22 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %17
+ %16 = OpLoad %ulong %22
+ OpStore %9 %16
+ %18 = OpLoad %ulong %9
+ %23 = OpBitcast %_ptr_Function_ulong %10
+ %24 = OpCopyObject %ulong %18
+ OpStore %23 %24
+ %43 = OpFunctionCall %void %1 %11 %10
+ %19 = OpLoad %ulong %11
+ OpStore %9 %19
+ %20 = OpLoad %ulong %8
%21 = OpLoad %ulong %9
- %29 = OpCopyObject %ulong %21
- %30 = OpCopyObject %ulong %29
- %20 = OpCopyObject %ulong %30
- OpStore %10 %20
- %23 = OpLoad %ulong %10
- %22 = OpFunctionCall %ulong %1 %23
- OpStore %11 %22
- %25 = OpLoad %ulong %11
- %24 = OpCopyObject %ulong %25
- OpStore %9 %24
- %26 = OpLoad %ulong %8
- %27 = OpLoad %ulong %9
- %31 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %26
- OpStore %31 %27
+ %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %20
+ OpStore %25 %21
OpReturn
OpFunctionEnd
- %1 = OpFunction %ulong None %53
- %36 = OpFunctionParameter %ulong
- %45 = OpLabel
- %34 = OpVariable %_ptr_Function_ulong Function
- %33 = OpVariable %_ptr_Function_ulong Function
- %35 = OpVariable %_ptr_Function_ulong Function
- OpStore %34 %36
- %38 = OpLoad %ulong %34
- %37 = OpCopyObject %ulong %38
- OpStore %35 %37
- %40 = OpLoad %ulong %35
- %39 = OpIAdd %ulong %40 %ulong_1
- OpStore %35 %39
- %42 = OpLoad %ulong %35
- %41 = OpCopyObject %ulong %42
- OpStore %33 %41
- %43 = OpLoad %ulong %33
- OpReturnValue %43
+ %1 = OpFunction %void None %44
+ %27 = OpFunctionParameter %_ptr_Function_ulong
+ %28 = OpFunctionParameter %_ptr_Function_ulong
+ %35 = OpLabel
+ %29 = OpVariable %_ptr_Function_ulong Function
+ %30 = OpLoad %ulong %28
+ OpStore %29 %30
+ %32 = OpLoad %ulong %29
+ %31 = OpIAdd %ulong %32 %ulong_1
+ OpStore %29 %31
+ %33 = OpLoad %ulong %29
+ OpStore %27 %33
+ OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/constant_f32.spvtxt b/ptx/src/test/spirv_run/constant_f32.spvtxt
index 27c5f4e..46193a2 100644
--- a/ptx/src/test/spirv_run/constant_f32.spvtxt
+++ b/ptx/src/test/spirv_run/constant_f32.spvtxt
@@ -1,57 +1,48 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 32
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%24 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "constant_f32"
-; OpDecorate %1 FunctionDenormModeINTEL 32 Preserve
-%25 = OpTypeVoid
-%26 = OpTypeInt 64 0
-%27 = OpTypeFunction %25 %26 %26
-%28 = OpTypePointer Function %26
-%29 = OpTypeFloat 32
-%30 = OpTypePointer Function %29
-%31 = OpTypePointer Generic %29
-%19 = OpConstant %29 0.5
-%1 = OpFunction %25 None %27
-%7 = OpFunctionParameter %26
-%8 = OpFunctionParameter %26
-%22 = OpLabel
-%2 = OpVariable %28 Function
-%3 = OpVariable %28 Function
-%4 = OpVariable %28 Function
-%5 = OpVariable %28 Function
-%6 = OpVariable %30 Function
-OpStore %2 %7
-OpStore %3 %8
-%10 = OpLoad %26 %2
-%9 = OpCopyObject %26 %10
-OpStore %4 %9
-%12 = OpLoad %26 %3
-%11 = OpCopyObject %26 %12
-OpStore %5 %11
-%14 = OpLoad %26 %4
-%20 = OpConvertUToPtr %31 %14
-%13 = OpLoad %29 %20
-OpStore %6 %13
-%16 = OpLoad %29 %6
-%15 = OpFMul %29 %16 %19
-OpStore %6 %15
-%17 = OpLoad %26 %5
-%18 = OpLoad %29 %6
-%21 = OpConvertUToPtr %31 %17
-OpStore %21 %18
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %22 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "constant_f32"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %25 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %float_0_5 = OpConstant %float 0.5
+ %1 = OpFunction %void None %25
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %20 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %18 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %18
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpFMul %float %14 %float_0_5
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %float %6
+ %19 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %19 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/constant_negative.spvtxt b/ptx/src/test/spirv_run/constant_negative.spvtxt
index ec2ff72..5532e6e 100644
--- a/ptx/src/test/spirv_run/constant_negative.spvtxt
+++ b/ptx/src/test/spirv_run/constant_negative.spvtxt
@@ -1,56 +1,48 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 32
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%24 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "constant_negative"
-%25 = OpTypeVoid
-%26 = OpTypeInt 64 0
-%27 = OpTypeFunction %25 %26 %26
-%28 = OpTypePointer Function %26
-%29 = OpTypeInt 32 0
-%30 = OpTypePointer Function %29
-%31 = OpTypePointer Generic %29
-%19 = OpConstant %29 4294967295
-%1 = OpFunction %25 None %27
-%7 = OpFunctionParameter %26
-%8 = OpFunctionParameter %26
-%22 = OpLabel
-%2 = OpVariable %28 Function
-%3 = OpVariable %28 Function
-%4 = OpVariable %28 Function
-%5 = OpVariable %28 Function
-%6 = OpVariable %30 Function
-OpStore %2 %7
-OpStore %3 %8
-%10 = OpLoad %26 %2
-%9 = OpCopyObject %26 %10
-OpStore %4 %9
-%12 = OpLoad %26 %3
-%11 = OpCopyObject %26 %12
-OpStore %5 %11
-%14 = OpLoad %26 %4
-%20 = OpConvertUToPtr %31 %14
-%13 = OpLoad %29 %20
-OpStore %6 %13
-%16 = OpLoad %29 %6
-%15 = OpIMul %29 %16 %19
-OpStore %6 %15
-%17 = OpLoad %26 %5
-%18 = OpLoad %29 %6
-%21 = OpConvertUToPtr %31 %17
-OpStore %21 %18
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %22 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "constant_negative"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %25 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %uint = OpTypeInt 32 0
+%_ptr_Function_uint = OpTypePointer Function %uint
+%_ptr_Generic_uint = OpTypePointer Generic %uint
+%uint_4294967295 = OpConstant %uint 4294967295
+ %1 = OpFunction %void None %25
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %20 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_uint Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %18 = OpConvertUToPtr %_ptr_Generic_uint %12
+ %11 = OpLoad %uint %18
+ OpStore %6 %11
+ %14 = OpLoad %uint %6
+ %13 = OpIMul %uint %14 %uint_4294967295
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %uint %6
+ %19 = OpConvertUToPtr %_ptr_Generic_uint %15
+ OpStore %19 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/cos.ptx b/ptx/src/test/spirv_run/cos.ptx
new file mode 100644
index 0000000..7983f20
--- /dev/null
+++ b/ptx/src/test/spirv_run/cos.ptx
@@ -0,0 +1,21 @@
+.version 6.5
+.target sm_30
+.address_size 64
+
+.visible .entry cos(
+ .param .u64 input,
+ .param .u64 output
+)
+{
+ .reg .u64 in_addr;
+ .reg .u64 out_addr;
+ .reg .f32 temp;
+
+ ld.param.u64 in_addr, [input];
+ ld.param.u64 out_addr, [output];
+
+ ld.f32 temp, [in_addr];
+ cos.approx.f32 temp, temp;
+ st.f32 [out_addr], temp;
+ ret;
+}
diff --git a/ptx/src/test/spirv_run/cos.spvtxt b/ptx/src/test/spirv_run/cos.spvtxt
new file mode 100644
index 0000000..6820142
--- /dev/null
+++ b/ptx/src/test/spirv_run/cos.spvtxt
@@ -0,0 +1,47 @@
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "cos"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %24 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %19 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %17
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpExtInst %float %21 cos %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %float %6
+ %18 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %18 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/cvt_sat_s_u.spvtxt b/ptx/src/test/spirv_run/cvt_sat_s_u.spvtxt
index 208c279..be321eb 100644
--- a/ptx/src/test/spirv_run/cvt_sat_s_u.spvtxt
+++ b/ptx/src/test/spirv_run/cvt_sat_s_u.spvtxt
@@ -2,22 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %27 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %25 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "cvt_sat_s_u"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %30 = OpTypeFunction %void %ulong %ulong
+ %28 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_Generic_uint = OpTypePointer Generic %uint
- %1 = OpFunction %void None %30
+ %1 = OpFunction %void None %28
%9 = OpFunctionParameter %ulong
%10 = OpFunctionParameter %ulong
- %25 = OpLabel
+ %23 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -27,25 +30,23 @@
%8 = OpVariable %_ptr_Function_uint Function
OpStore %2 %9
OpStore %3 %10
- %12 = OpLoad %ulong %2
- %11 = OpCopyObject %ulong %12
+ %11 = OpLoad %ulong %2
OpStore %4 %11
- %14 = OpLoad %ulong %3
- %13 = OpCopyObject %ulong %14
- OpStore %5 %13
- %16 = OpLoad %ulong %4
- %23 = OpConvertUToPtr %_ptr_Generic_uint %16
- %15 = OpLoad %uint %23
- OpStore %6 %15
- %18 = OpLoad %uint %6
- %17 = OpSatConvertSToU %uint %18
- OpStore %7 %17
- %20 = OpLoad %uint %7
- %19 = OpBitcast %uint %20
- OpStore %8 %19
- %21 = OpLoad %ulong %5
- %22 = OpLoad %uint %8
- %24 = OpConvertUToPtr %_ptr_Generic_uint %21
- OpStore %24 %22
+ %12 = OpLoad %ulong %3
+ OpStore %5 %12
+ %14 = OpLoad %ulong %4
+ %21 = OpConvertUToPtr %_ptr_Generic_uint %14
+ %13 = OpLoad %uint %21
+ OpStore %6 %13
+ %16 = OpLoad %uint %6
+ %15 = OpSatConvertSToU %uint %16
+ OpStore %7 %15
+ %18 = OpLoad %uint %7
+ %17 = OpBitcast %uint %18
+ OpStore %8 %17
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %uint %8
+ %22 = OpConvertUToPtr %_ptr_Generic_uint %19
+ OpStore %22 %20
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/cvta.spvtxt b/ptx/src/test/spirv_run/cvta.spvtxt
index 84e7eac..cf6ff8b 100644
--- a/ptx/src/test/spirv_run/cvta.spvtxt
+++ b/ptx/src/test/spirv_run/cvta.spvtxt
@@ -2,22 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %29 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %27 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "cvta"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %32 = OpTypeFunction %void %ulong %ulong
+ %30 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%float = OpTypeFloat 32
%_ptr_Function_float = OpTypePointer Function %float
%_ptr_CrossWorkgroup_float = OpTypePointer CrossWorkgroup %float
- %1 = OpFunction %void None %32
+ %1 = OpFunction %void None %30
%7 = OpFunctionParameter %ulong
%8 = OpFunctionParameter %ulong
- %27 = OpLabel
+ %25 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -25,29 +28,27 @@
%6 = OpVariable %_ptr_Function_float Function
OpStore %2 %7
OpStore %3 %8
- %10 = OpLoad %ulong %2
- %9 = OpCopyObject %ulong %10
+ %9 = OpLoad %ulong %2
OpStore %4 %9
- %12 = OpLoad %ulong %3
- %11 = OpCopyObject %ulong %12
- OpStore %5 %11
- %14 = OpLoad %ulong %4
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %20 = OpCopyObject %ulong %12
+ %19 = OpCopyObject %ulong %20
+ %11 = OpCopyObject %ulong %19
+ OpStore %4 %11
+ %14 = OpLoad %ulong %5
%22 = OpCopyObject %ulong %14
%21 = OpCopyObject %ulong %22
%13 = OpCopyObject %ulong %21
- OpStore %4 %13
- %16 = OpLoad %ulong %5
- %24 = OpCopyObject %ulong %16
- %23 = OpCopyObject %ulong %24
- %15 = OpCopyObject %ulong %23
- OpStore %5 %15
- %18 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %18
- %17 = OpLoad %float %25
- OpStore %6 %17
- %19 = OpLoad %ulong %5
- %20 = OpLoad %float %6
- %26 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %19
- OpStore %26 %20
+ OpStore %5 %13
+ %16 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %16
+ %15 = OpLoad %float %23
+ OpStore %6 %15
+ %17 = OpLoad %ulong %5
+ %18 = OpLoad %float %6
+ %24 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %17
+ OpStore %24 %18
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/div_approx.spvtxt b/ptx/src/test/spirv_run/div_approx.spvtxt
index 40cc152..c62888c 100644
--- a/ptx/src/test/spirv_run/div_approx.spvtxt
+++ b/ptx/src/test/spirv_run/div_approx.spvtxt
@@ -1,65 +1,56 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 38
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%30 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "div_approx"
-OpDecorate %1 FunctionDenormModeINTEL 32 Preserve
-OpDecorate %18 FPFastMathMode AllowRecip
-%31 = OpTypeVoid
-%32 = OpTypeInt 64 0
-%33 = OpTypeFunction %31 %32 %32
-%34 = OpTypePointer Function %32
-%35 = OpTypeFloat 32
-%36 = OpTypePointer Function %35
-%37 = OpTypePointer Generic %35
-%23 = OpConstant %32 4
-%1 = OpFunction %31 None %33
-%8 = OpFunctionParameter %32
-%9 = OpFunctionParameter %32
-%28 = OpLabel
-%2 = OpVariable %34 Function
-%3 = OpVariable %34 Function
-%4 = OpVariable %34 Function
-%5 = OpVariable %34 Function
-%6 = OpVariable %36 Function
-%7 = OpVariable %36 Function
-OpStore %2 %8
-OpStore %3 %9
-%11 = OpLoad %32 %2
-%10 = OpCopyObject %32 %11
-OpStore %4 %10
-%13 = OpLoad %32 %3
-%12 = OpCopyObject %32 %13
-OpStore %5 %12
-%15 = OpLoad %32 %4
-%25 = OpConvertUToPtr %37 %15
-%14 = OpLoad %35 %25
-OpStore %6 %14
-%17 = OpLoad %32 %4
-%24 = OpIAdd %32 %17 %23
-%26 = OpConvertUToPtr %37 %24
-%16 = OpLoad %35 %26
-OpStore %7 %16
-%19 = OpLoad %35 %6
-%20 = OpLoad %35 %7
-%18 = OpFDiv %35 %19 %20
-OpStore %6 %18
-%21 = OpLoad %32 %5
-%22 = OpLoad %35 %6
-%27 = OpConvertUToPtr %37 %21
-OpStore %27 %22
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %28 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "div_approx"
+ OpDecorate %16 FPFastMathMode AllowRecip
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %31 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %ulong_4 = OpConstant %ulong 4
+ %1 = OpFunction %void None %31
+ %8 = OpFunctionParameter %ulong
+ %9 = OpFunctionParameter %ulong
+ %26 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ %7 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %8
+ OpStore %3 %9
+ %10 = OpLoad %ulong %2
+ OpStore %4 %10
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_float %13
+ %12 = OpLoad %float %23
+ OpStore %6 %12
+ %15 = OpLoad %ulong %4
+ %22 = OpIAdd %ulong %15 %ulong_4
+ %24 = OpConvertUToPtr %_ptr_Generic_float %22
+ %14 = OpLoad %float %24
+ OpStore %7 %14
+ %17 = OpLoad %float %6
+ %18 = OpLoad %float %7
+ %16 = OpFDiv %float %17 %18
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %float %6
+ %25 = OpConvertUToPtr %_ptr_Generic_float %19
+ OpStore %25 %20
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/ex2.ptx b/ptx/src/test/spirv_run/ex2.ptx
new file mode 100644
index 0000000..1edbcc6
--- /dev/null
+++ b/ptx/src/test/spirv_run/ex2.ptx
@@ -0,0 +1,21 @@
+.version 6.5
+.target sm_30
+.address_size 64
+
+.visible .entry ex2(
+ .param .u64 input,
+ .param .u64 output
+)
+{
+ .reg .u64 in_addr;
+ .reg .u64 out_addr;
+ .reg .f32 temp;
+
+ ld.param.u64 in_addr, [input];
+ ld.param.u64 out_addr, [output];
+
+ ld.f32 temp, [in_addr];
+ ex2.approx.f32 temp, temp;
+ st.f32 [out_addr], temp;
+ ret;
+}
diff --git a/ptx/src/test/spirv_run/ex2.spvtxt b/ptx/src/test/spirv_run/ex2.spvtxt
new file mode 100644
index 0000000..e9be3e3
--- /dev/null
+++ b/ptx/src/test/spirv_run/ex2.spvtxt
@@ -0,0 +1,47 @@
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "ex2"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %24 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %19 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %17
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpExtInst %float %21 exp2 %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %float %6
+ %18 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %18 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/extern_shared.spvtxt b/ptx/src/test/spirv_run/extern_shared.spvtxt
index b184980..fca8ee7 100644
--- a/ptx/src/test/spirv_run/extern_shared.spvtxt
+++ b/ptx/src/test/spirv_run/extern_shared.spvtxt
@@ -7,7 +7,7 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %32 = OpExtInstImport "OpenCL.std"
+ %30 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %2 "extern_shared" %1
%void = OpTypeVoid
@@ -18,51 +18,49 @@
%ulong = OpTypeInt 64 0
%uchar = OpTypeInt 8 0
%_ptr_Workgroup_uchar = OpTypePointer Workgroup %uchar
- %40 = OpTypeFunction %void %ulong %ulong %_ptr_Workgroup_uchar
+ %38 = OpTypeFunction %void %ulong %ulong %_ptr_Workgroup_uchar
%_ptr_Function__ptr_Workgroup_uchar = OpTypePointer Function %_ptr_Workgroup_uchar
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_CrossWorkgroup_ulong = OpTypePointer CrossWorkgroup %ulong
%_ptr_Function__ptr_Workgroup_uint = OpTypePointer Function %_ptr_Workgroup_uint
%_ptr_Workgroup_ulong = OpTypePointer Workgroup %ulong
- %2 = OpFunction %void None %40
+ %2 = OpFunction %void None %38
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %28 = OpFunctionParameter %_ptr_Workgroup_uchar
- %41 = OpLabel
- %29 = OpVariable %_ptr_Function__ptr_Workgroup_uchar Function
+ %26 = OpFunctionParameter %_ptr_Workgroup_uchar
+ %39 = OpLabel
+ %27 = OpVariable %_ptr_Function__ptr_Workgroup_uchar Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
%5 = OpVariable %_ptr_Function_ulong Function
%6 = OpVariable %_ptr_Function_ulong Function
%7 = OpVariable %_ptr_Function_ulong Function
- OpStore %29 %28
- OpBranch %26
- %26 = OpLabel
+ OpStore %27 %26
+ OpBranch %24
+ %24 = OpLabel
OpStore %3 %8
OpStore %4 %9
- %11 = OpLoad %ulong %3
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %3
OpStore %5 %10
- %13 = OpLoad %ulong %4
- %12 = OpCopyObject %ulong %13
- OpStore %6 %12
- %15 = OpLoad %ulong %5
- %22 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %15
- %14 = OpLoad %ulong %22
- OpStore %7 %14
- %30 = OpBitcast %_ptr_Function__ptr_Workgroup_uint %29
- %16 = OpLoad %_ptr_Workgroup_uint %30
- %17 = OpLoad %ulong %7
- %23 = OpBitcast %_ptr_Workgroup_ulong %16
- OpStore %23 %17
- %31 = OpBitcast %_ptr_Function__ptr_Workgroup_uint %29
- %19 = OpLoad %_ptr_Workgroup_uint %31
- %24 = OpBitcast %_ptr_Workgroup_ulong %19
- %18 = OpLoad %ulong %24
- OpStore %7 %18
- %20 = OpLoad %ulong %6
- %21 = OpLoad %ulong %7
- %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %20
- OpStore %25 %21
+ %11 = OpLoad %ulong %4
+ OpStore %6 %11
+ %13 = OpLoad %ulong %5
+ %20 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %13
+ %12 = OpLoad %ulong %20
+ OpStore %7 %12
+ %28 = OpBitcast %_ptr_Function__ptr_Workgroup_uint %27
+ %14 = OpLoad %_ptr_Workgroup_uint %28
+ %15 = OpLoad %ulong %7
+ %21 = OpBitcast %_ptr_Workgroup_ulong %14
+ OpStore %21 %15
+ %29 = OpBitcast %_ptr_Function__ptr_Workgroup_uint %27
+ %17 = OpLoad %_ptr_Workgroup_uint %29
+ %22 = OpBitcast %_ptr_Workgroup_ulong %17
+ %16 = OpLoad %ulong %22
+ OpStore %7 %16
+ %18 = OpLoad %ulong %6
+ %19 = OpLoad %ulong %7
+ %23 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %18
+ OpStore %23 %19
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/fma.spvtxt b/ptx/src/test/spirv_run/fma.spvtxt
index 4a90d09..9716198 100644
--- a/ptx/src/test/spirv_run/fma.spvtxt
+++ b/ptx/src/test/spirv_run/fma.spvtxt
@@ -1,72 +1,63 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 45
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%37 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "fma"
-; OpDecorate %1 FunctionDenormModeINTEL 32 Preserve
-%38 = OpTypeVoid
-%39 = OpTypeInt 64 0
-%40 = OpTypeFunction %38 %39 %39
-%41 = OpTypePointer Function %39
-%42 = OpTypeFloat 32
-%43 = OpTypePointer Function %42
-%44 = OpTypePointer Generic %42
-%27 = OpConstant %39 4
-%29 = OpConstant %39 8
-%1 = OpFunction %38 None %40
-%9 = OpFunctionParameter %39
-%10 = OpFunctionParameter %39
-%35 = OpLabel
-%2 = OpVariable %41 Function
-%3 = OpVariable %41 Function
-%4 = OpVariable %41 Function
-%5 = OpVariable %41 Function
-%6 = OpVariable %43 Function
-%7 = OpVariable %43 Function
-%8 = OpVariable %43 Function
-OpStore %2 %9
-OpStore %3 %10
-%12 = OpLoad %39 %2
-%11 = OpCopyObject %39 %12
-OpStore %4 %11
-%14 = OpLoad %39 %3
-%13 = OpCopyObject %39 %14
-OpStore %5 %13
-%16 = OpLoad %39 %4
-%31 = OpConvertUToPtr %44 %16
-%15 = OpLoad %42 %31
-OpStore %6 %15
-%18 = OpLoad %39 %4
-%28 = OpIAdd %39 %18 %27
-%32 = OpConvertUToPtr %44 %28
-%17 = OpLoad %42 %32
-OpStore %7 %17
-%20 = OpLoad %39 %4
-%30 = OpIAdd %39 %20 %29
-%33 = OpConvertUToPtr %44 %30
-%19 = OpLoad %42 %33
-OpStore %8 %19
-%22 = OpLoad %42 %6
-%23 = OpLoad %42 %7
-%24 = OpLoad %42 %8
-%21 = OpExtInst %42 %37 mad %22 %23 %24
-OpStore %6 %21
-%25 = OpLoad %39 %5
-%26 = OpLoad %42 %6
-%34 = OpConvertUToPtr %44 %25
-OpStore %34 %26
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %35 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "fma"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %38 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %ulong_4 = OpConstant %ulong 4
+ %ulong_8 = OpConstant %ulong 8
+ %1 = OpFunction %void None %38
+ %9 = OpFunctionParameter %ulong
+ %10 = OpFunctionParameter %ulong
+ %33 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ %7 = OpVariable %_ptr_Function_float Function
+ %8 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %9
+ OpStore %3 %10
+ %11 = OpLoad %ulong %2
+ OpStore %4 %11
+ %12 = OpLoad %ulong %3
+ OpStore %5 %12
+ %14 = OpLoad %ulong %4
+ %29 = OpConvertUToPtr %_ptr_Generic_float %14
+ %13 = OpLoad %float %29
+ OpStore %6 %13
+ %16 = OpLoad %ulong %4
+ %26 = OpIAdd %ulong %16 %ulong_4
+ %30 = OpConvertUToPtr %_ptr_Generic_float %26
+ %15 = OpLoad %float %30
+ OpStore %7 %15
+ %18 = OpLoad %ulong %4
+ %28 = OpIAdd %ulong %18 %ulong_8
+ %31 = OpConvertUToPtr %_ptr_Generic_float %28
+ %17 = OpLoad %float %31
+ OpStore %8 %17
+ %20 = OpLoad %float %6
+ %21 = OpLoad %float %7
+ %22 = OpLoad %float %8
+ %19 = OpExtInst %float %35 mad %20 %21 %22
+ OpStore %6 %19
+ %23 = OpLoad %ulong %5
+ %24 = OpLoad %float %6
+ %32 = OpConvertUToPtr %_ptr_Generic_float %23
+ OpStore %32 %24
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/global_array.spvtxt b/ptx/src/test/spirv_run/global_array.spvtxt
index a4ed91d..25874ac 100644
--- a/ptx/src/test/spirv_run/global_array.spvtxt
+++ b/ptx/src/test/spirv_run/global_array.spvtxt
@@ -7,28 +7,28 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %22 = OpExtInstImport "OpenCL.std"
+ %21 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %2 "global_array" %1
%void = OpTypeVoid
%uint = OpTypeInt 32 0
%uint_4 = OpConstant %uint 4
%_arr_uint_uint_4 = OpTypeArray %uint %uint_4
-%_ptr_CrossWorkgroup__arr_uint_uint_4 = OpTypePointer CrossWorkgroup %_arr_uint_uint_4
- %uint_4_0 = OpConstant %uint 4
%uint_1 = OpConstant %uint 1
%uint_0 = OpConstant %uint 0
- %31 = OpConstantComposite %_arr_uint_uint_4 %uint_1 %uint_0 %uint_0 %uint_0
- %1 = OpVariable %_ptr_CrossWorkgroup__arr_uint_uint_4 CrossWorkgroup %31
+ %28 = OpConstantComposite %_arr_uint_uint_4 %uint_1 %uint_0 %uint_0 %uint_0
+ %uint_4_0 = OpConstant %uint 4
+%_ptr_CrossWorkgroup__arr_uint_uint_4 = OpTypePointer CrossWorkgroup %_arr_uint_uint_4
+ %1 = OpVariable %_ptr_CrossWorkgroup__arr_uint_uint_4 CrossWorkgroup %28
%ulong = OpTypeInt 64 0
- %33 = OpTypeFunction %void %ulong %ulong
+ %32 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_CrossWorkgroup_uint = OpTypePointer CrossWorkgroup %uint
- %2 = OpFunction %void None %33
+ %2 = OpFunction %void None %32
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %20 = OpLabel
+ %19 = OpLabel
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
%5 = OpVariable %_ptr_Function_ulong Function
@@ -36,19 +36,18 @@
%7 = OpVariable %_ptr_Function_uint Function
OpStore %3 %8
OpStore %4 %9
- %17 = OpConvertPtrToU %ulong %1
- %10 = OpCopyObject %ulong %17
+ %16 = OpConvertPtrToU %ulong %1
+ %10 = OpCopyObject %ulong %16
OpStore %5 %10
- %12 = OpLoad %ulong %4
- %11 = OpCopyObject %ulong %12
+ %11 = OpLoad %ulong %4
OpStore %6 %11
- %14 = OpLoad %ulong %5
+ %13 = OpLoad %ulong %5
+ %17 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %13
+ %12 = OpLoad %uint %17
+ OpStore %7 %12
+ %14 = OpLoad %ulong %6
+ %15 = OpLoad %uint %7
%18 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %14
- %13 = OpLoad %uint %18
- OpStore %7 %13
- %15 = OpLoad %ulong %6
- %16 = OpLoad %uint %7
- %19 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %15
- OpStore %19 %16
+ OpStore %18 %15
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/implicit_param.spvtxt b/ptx/src/test/spirv_run/implicit_param.spvtxt
index c30788c..a78e53f 100644
--- a/ptx/src/test/spirv_run/implicit_param.spvtxt
+++ b/ptx/src/test/spirv_run/implicit_param.spvtxt
@@ -2,25 +2,27 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
OpCapability Float64
- %28 = OpExtInstImport "OpenCL.std"
+ %24 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "implicit_param"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %31 = OpTypeFunction %void %ulong %ulong
+ %27 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%float = OpTypeFloat 32
%_ptr_Function_float = OpTypePointer Function %float
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_CrossWorkgroup_float = OpTypePointer CrossWorkgroup %float
- %1 = OpFunction %void None %31
+ %1 = OpFunction %void None %27
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %26 = OpLabel
+ %22 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -29,27 +31,23 @@
%7 = OpVariable %_ptr_Function_uint Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %22 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %15
- %14 = OpLoad %float %22
- OpStore %6 %14
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %18 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %13
+ %12 = OpLoad %float %18
+ OpStore %6 %12
+ %14 = OpLoad %float %6
+ %19 = OpBitcast %_ptr_Function_float %7
+ OpStore %19 %14
+ %20 = OpBitcast %_ptr_Function_float %7
+ %15 = OpLoad %float %20
+ OpStore %6 %15
+ %16 = OpLoad %ulong %5
%17 = OpLoad %float %6
- %23 = OpCopyObject %float %17
- %16 = OpBitcast %uint %23
- OpStore %7 %16
- %19 = OpLoad %uint %7
- %24 = OpBitcast %float %19
- %18 = OpCopyObject %float %24
- OpStore %6 %18
- %20 = OpLoad %ulong %5
- %21 = OpLoad %float %6
- %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %20
- OpStore %25 %21
+ %21 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %16
+ OpStore %21 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/ld_st.spvtxt b/ptx/src/test/spirv_run/ld_st.spvtxt
index d36db57..8e3f98d 100644
--- a/ptx/src/test/spirv_run/ld_st.spvtxt
+++ b/ptx/src/test/spirv_run/ld_st.spvtxt
@@ -2,20 +2,23 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %21 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %19 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "ld_st"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %24 = OpTypeFunction %void %ulong %ulong
+ %22 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %24
+ %1 = OpFunction %void None %22
%7 = OpFunctionParameter %ulong
%8 = OpFunctionParameter %ulong
- %19 = OpLabel
+ %17 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -23,19 +26,17 @@
%6 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %7
OpStore %3 %8
- %10 = OpLoad %ulong %2
- %9 = OpCopyObject %ulong %10
+ %9 = OpLoad %ulong %2
OpStore %4 %9
- %12 = OpLoad %ulong %3
- %11 = OpCopyObject %ulong %12
- OpStore %5 %11
- %14 = OpLoad %ulong %4
- %17 = OpConvertUToPtr %_ptr_Generic_ulong %14
- %13 = OpLoad %ulong %17
- OpStore %6 %13
- %15 = OpLoad %ulong %5
- %16 = OpLoad %ulong %6
- %18 = OpConvertUToPtr %_ptr_Generic_ulong %15
- OpStore %18 %16
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %15 = OpConvertUToPtr %_ptr_Generic_ulong %12
+ %11 = OpLoad %ulong %15
+ OpStore %6 %11
+ %13 = OpLoad %ulong %5
+ %14 = OpLoad %ulong %6
+ %16 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ OpStore %16 %14
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/ld_st_implicit.spvtxt b/ptx/src/test/spirv_run/ld_st_implicit.spvtxt
index d4d9499..35f715b 100644
--- a/ptx/src/test/spirv_run/ld_st_implicit.spvtxt
+++ b/ptx/src/test/spirv_run/ld_st_implicit.spvtxt
@@ -7,20 +7,20 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %23 = OpExtInstImport "OpenCL.std"
+ %21 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "ld_st_implicit"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %26 = OpTypeFunction %void %ulong %ulong
+ %24 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%float = OpTypeFloat 32
%_ptr_CrossWorkgroup_float = OpTypePointer CrossWorkgroup %float
%uint = OpTypeInt 32 0
- %1 = OpFunction %void None %26
+ %1 = OpFunction %void None %24
%7 = OpFunctionParameter %ulong
%8 = OpFunctionParameter %ulong
- %21 = OpLabel
+ %19 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -28,24 +28,22 @@
%6 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %7
OpStore %3 %8
- %10 = OpLoad %ulong %2
- %9 = OpCopyObject %ulong %10
+ %9 = OpLoad %ulong %2
OpStore %4 %9
- %12 = OpLoad %ulong %3
- %11 = OpCopyObject %ulong %12
- OpStore %5 %11
- %14 = OpLoad %ulong %4
- %18 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %14
- %17 = OpLoad %float %18
- %31 = OpBitcast %uint %17
- %13 = OpUConvert %ulong %31
- OpStore %6 %13
- %15 = OpLoad %ulong %5
- %16 = OpLoad %ulong %6
- %19 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %15
- %32 = OpBitcast %ulong %16
- %33 = OpUConvert %uint %32
- %20 = OpBitcast %float %33
- OpStore %19 %20
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %16 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %12
+ %15 = OpLoad %float %16
+ %29 = OpBitcast %uint %15
+ %11 = OpUConvert %ulong %29
+ OpStore %6 %11
+ %13 = OpLoad %ulong %5
+ %14 = OpLoad %ulong %6
+ %17 = OpConvertUToPtr %_ptr_CrossWorkgroup_float %13
+ %30 = OpBitcast %ulong %14
+ %31 = OpUConvert %uint %30
+ %18 = OpBitcast %float %31
+ OpStore %17 %18
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/ld_st_offset.spvtxt b/ptx/src/test/spirv_run/ld_st_offset.spvtxt
index 208b53b..963d88a 100644
--- a/ptx/src/test/spirv_run/ld_st_offset.spvtxt
+++ b/ptx/src/test/spirv_run/ld_st_offset.spvtxt
@@ -2,24 +2,27 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %32 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %30 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "ld_st_offset"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %35 = OpTypeFunction %void %ulong %ulong
+ %33 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_Generic_uint = OpTypePointer Generic %uint
%ulong_4 = OpConstant %ulong 4
%ulong_4_0 = OpConstant %ulong 4
- %1 = OpFunction %void None %35
+ %1 = OpFunction %void None %33
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %30 = OpLabel
+ %28 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -28,29 +31,27 @@
%7 = OpVariable %_ptr_Function_uint Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %24 = OpConvertUToPtr %_ptr_Generic_uint %13
+ %12 = OpLoad %uint %24
+ OpStore %6 %12
%15 = OpLoad %ulong %4
- %26 = OpConvertUToPtr %_ptr_Generic_uint %15
- %14 = OpLoad %uint %26
- OpStore %6 %14
- %17 = OpLoad %ulong %4
- %23 = OpIAdd %ulong %17 %ulong_4
- %27 = OpConvertUToPtr %_ptr_Generic_uint %23
- %16 = OpLoad %uint %27
- OpStore %7 %16
+ %21 = OpIAdd %ulong %15 %ulong_4
+ %25 = OpConvertUToPtr %_ptr_Generic_uint %21
+ %14 = OpLoad %uint %25
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %uint %7
+ %26 = OpConvertUToPtr %_ptr_Generic_uint %16
+ OpStore %26 %17
%18 = OpLoad %ulong %5
- %19 = OpLoad %uint %7
- %28 = OpConvertUToPtr %_ptr_Generic_uint %18
- OpStore %28 %19
- %20 = OpLoad %ulong %5
- %21 = OpLoad %uint %6
- %25 = OpIAdd %ulong %20 %ulong_4_0
- %29 = OpConvertUToPtr %_ptr_Generic_uint %25
- OpStore %29 %21
+ %19 = OpLoad %uint %6
+ %23 = OpIAdd %ulong %18 %ulong_4_0
+ %27 = OpConvertUToPtr %_ptr_Generic_uint %23
+ OpStore %27 %19
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/lg2.ptx b/ptx/src/test/spirv_run/lg2.ptx
new file mode 100644
index 0000000..c571955
--- /dev/null
+++ b/ptx/src/test/spirv_run/lg2.ptx
@@ -0,0 +1,21 @@
+.version 6.5
+.target sm_30
+.address_size 64
+
+.visible .entry lg2(
+ .param .u64 input,
+ .param .u64 output
+)
+{
+ .reg .u64 in_addr;
+ .reg .u64 out_addr;
+ .reg .f32 temp;
+
+ ld.param.u64 in_addr, [input];
+ ld.param.u64 out_addr, [output];
+
+ ld.f32 temp, [in_addr];
+ lg2.approx.f32 temp, temp;
+ st.f32 [out_addr], temp;
+ ret;
+}
diff --git a/ptx/src/test/spirv_run/lg2.spvtxt b/ptx/src/test/spirv_run/lg2.spvtxt
new file mode 100644
index 0000000..d30fe8a
--- /dev/null
+++ b/ptx/src/test/spirv_run/lg2.spvtxt
@@ -0,0 +1,47 @@
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "lg2"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %24 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %19 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %17
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpExtInst %float %21 log2 %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %float %6
+ %18 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %18 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/local_align.spvtxt b/ptx/src/test/spirv_run/local_align.spvtxt
index 2482a75..915ac6f 100644
--- a/ptx/src/test/spirv_run/local_align.spvtxt
+++ b/ptx/src/test/spirv_run/local_align.spvtxt
@@ -2,26 +2,29 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %22 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %20 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "local_align"
OpDecorate %4 Alignment 8
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %25 = OpTypeFunction %void %ulong %ulong
+ %23 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
- %uchar = OpTypeInt 8 0
%uint = OpTypeInt 32 0
+ %uchar = OpTypeInt 8 0
%uint_8 = OpConstant %uint 8
%_arr_uchar_uint_8 = OpTypeArray %uchar %uint_8
%_ptr_Function__arr_uchar_uint_8 = OpTypePointer Function %_arr_uchar_uint_8
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %25
+ %1 = OpFunction %void None %23
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %20 = OpLabel
+ %18 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function__arr_uchar_uint_8 Function
@@ -30,19 +33,17 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %5 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %6 %12
- %15 = OpLoad %ulong %5
- %18 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %18
- OpStore %7 %14
- %16 = OpLoad %ulong %6
- %17 = OpLoad %ulong %7
- %19 = OpConvertUToPtr %_ptr_Generic_ulong %16
- OpStore %19 %17
+ %11 = OpLoad %ulong %3
+ OpStore %6 %11
+ %13 = OpLoad %ulong %5
+ %16 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %16
+ OpStore %7 %12
+ %14 = OpLoad %ulong %6
+ %15 = OpLoad %ulong %7
+ %17 = OpConvertUToPtr %_ptr_Generic_ulong %14
+ OpStore %17 %15
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/mad_s32.spvtxt b/ptx/src/test/spirv_run/mad_s32.spvtxt
index 3a7153d..9150089 100644
--- a/ptx/src/test/spirv_run/mad_s32.spvtxt
+++ b/ptx/src/test/spirv_run/mad_s32.spvtxt
@@ -2,15 +2,17 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
OpCapability Float64
- %48 = OpExtInstImport "OpenCL.std"
+ %46 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "mad_s32"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %51 = OpTypeFunction %void %ulong %ulong
+ %49 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
@@ -19,10 +21,10 @@
%ulong_8 = OpConstant %ulong 8
%ulong_4_0 = OpConstant %ulong 4
%ulong_8_0 = OpConstant %ulong 8
- %1 = OpFunction %void None %51
+ %1 = OpFunction %void None %49
%10 = OpFunctionParameter %ulong
%11 = OpFunctionParameter %ulong
- %46 = OpLabel
+ %44 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -33,45 +35,43 @@
%9 = OpVariable %_ptr_Function_uint Function
OpStore %2 %10
OpStore %3 %11
- %13 = OpLoad %ulong %2
- %12 = OpCopyObject %ulong %13
+ %12 = OpLoad %ulong %2
OpStore %4 %12
- %15 = OpLoad %ulong %3
- %14 = OpCopyObject %ulong %15
- OpStore %5 %14
+ %13 = OpLoad %ulong %3
+ OpStore %5 %13
+ %15 = OpLoad %ulong %4
+ %38 = OpConvertUToPtr %_ptr_Generic_uint %15
+ %14 = OpLoad %uint %38
+ OpStore %7 %14
%17 = OpLoad %ulong %4
- %40 = OpConvertUToPtr %_ptr_Generic_uint %17
- %16 = OpLoad %uint %40
- OpStore %7 %16
+ %31 = OpIAdd %ulong %17 %ulong_4
+ %39 = OpConvertUToPtr %_ptr_Generic_uint %31
+ %16 = OpLoad %uint %39
+ OpStore %8 %16
%19 = OpLoad %ulong %4
- %33 = OpIAdd %ulong %19 %ulong_4
- %41 = OpConvertUToPtr %_ptr_Generic_uint %33
- %18 = OpLoad %uint %41
- OpStore %8 %18
- %21 = OpLoad %ulong %4
- %35 = OpIAdd %ulong %21 %ulong_8
- %42 = OpConvertUToPtr %_ptr_Generic_uint %35
- %20 = OpLoad %uint %42
- OpStore %9 %20
- %23 = OpLoad %uint %7
- %24 = OpLoad %uint %8
- %25 = OpLoad %uint %9
- %56 = OpIMul %uint %23 %24
- %22 = OpIAdd %uint %25 %56
- OpStore %6 %22
+ %33 = OpIAdd %ulong %19 %ulong_8
+ %40 = OpConvertUToPtr %_ptr_Generic_uint %33
+ %18 = OpLoad %uint %40
+ OpStore %9 %18
+ %21 = OpLoad %uint %7
+ %22 = OpLoad %uint %8
+ %23 = OpLoad %uint %9
+ %54 = OpIMul %uint %21 %22
+ %20 = OpIAdd %uint %23 %54
+ OpStore %6 %20
+ %24 = OpLoad %ulong %5
+ %25 = OpLoad %uint %6
+ %41 = OpConvertUToPtr %_ptr_Generic_uint %24
+ OpStore %41 %25
%26 = OpLoad %ulong %5
%27 = OpLoad %uint %6
- %43 = OpConvertUToPtr %_ptr_Generic_uint %26
- OpStore %43 %27
+ %35 = OpIAdd %ulong %26 %ulong_4_0
+ %42 = OpConvertUToPtr %_ptr_Generic_uint %35
+ OpStore %42 %27
%28 = OpLoad %ulong %5
%29 = OpLoad %uint %6
- %37 = OpIAdd %ulong %28 %ulong_4_0
- %44 = OpConvertUToPtr %_ptr_Generic_uint %37
- OpStore %44 %29
- %30 = OpLoad %ulong %5
- %31 = OpLoad %uint %6
- %39 = OpIAdd %ulong %30 %ulong_8_0
- %45 = OpConvertUToPtr %_ptr_Generic_uint %39
- OpStore %45 %31
+ %37 = OpIAdd %ulong %28 %ulong_8_0
+ %43 = OpConvertUToPtr %_ptr_Generic_uint %37
+ OpStore %43 %29
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/max.spvtxt b/ptx/src/test/spirv_run/max.spvtxt
index cab9a9a..05eb705 100644
--- a/ptx/src/test/spirv_run/max.spvtxt
+++ b/ptx/src/test/spirv_run/max.spvtxt
@@ -7,21 +7,21 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %30 = OpExtInstImport "OpenCL.std"
+ %28 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "max"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %33 = OpTypeFunction %void %ulong %ulong
+ %31 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_Generic_uint = OpTypePointer Generic %uint
%ulong_4 = OpConstant %ulong 4
- %1 = OpFunction %void None %33
+ %1 = OpFunction %void None %31
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %28 = OpLabel
+ %26 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -30,28 +30,26 @@
%7 = OpVariable %_ptr_Function_uint Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_uint %13
+ %12 = OpLoad %uint %23
+ OpStore %6 %12
%15 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_Generic_uint %15
- %14 = OpLoad %uint %25
- OpStore %6 %14
- %17 = OpLoad %ulong %4
- %24 = OpIAdd %ulong %17 %ulong_4
- %26 = OpConvertUToPtr %_ptr_Generic_uint %24
- %16 = OpLoad %uint %26
- OpStore %7 %16
- %19 = OpLoad %uint %6
- %20 = OpLoad %uint %7
- %18 = OpExtInst %uint %30 s_max %19 %20
- OpStore %6 %18
- %21 = OpLoad %ulong %5
- %22 = OpLoad %uint %6
- %27 = OpConvertUToPtr %_ptr_Generic_uint %21
- OpStore %27 %22
+ %22 = OpIAdd %ulong %15 %ulong_4
+ %24 = OpConvertUToPtr %_ptr_Generic_uint %22
+ %14 = OpLoad %uint %24
+ OpStore %7 %14
+ %17 = OpLoad %uint %6
+ %18 = OpLoad %uint %7
+ %16 = OpExtInst %uint %28 s_max %17 %18
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %uint %6
+ %25 = OpConvertUToPtr %_ptr_Generic_uint %19
+ OpStore %25 %20
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/min.spvtxt b/ptx/src/test/spirv_run/min.spvtxt
index 119cd15..d0d2b9a 100644
--- a/ptx/src/test/spirv_run/min.spvtxt
+++ b/ptx/src/test/spirv_run/min.spvtxt
@@ -7,21 +7,21 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %30 = OpExtInstImport "OpenCL.std"
+ %28 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "min"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %33 = OpTypeFunction %void %ulong %ulong
+ %31 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_Generic_uint = OpTypePointer Generic %uint
%ulong_4 = OpConstant %ulong 4
- %1 = OpFunction %void None %33
+ %1 = OpFunction %void None %31
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %28 = OpLabel
+ %26 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -30,28 +30,26 @@
%7 = OpVariable %_ptr_Function_uint Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_uint %13
+ %12 = OpLoad %uint %23
+ OpStore %6 %12
%15 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_Generic_uint %15
- %14 = OpLoad %uint %25
- OpStore %6 %14
- %17 = OpLoad %ulong %4
- %24 = OpIAdd %ulong %17 %ulong_4
- %26 = OpConvertUToPtr %_ptr_Generic_uint %24
- %16 = OpLoad %uint %26
- OpStore %7 %16
- %19 = OpLoad %uint %6
- %20 = OpLoad %uint %7
- %18 = OpExtInst %uint %30 s_min %19 %20
- OpStore %6 %18
- %21 = OpLoad %ulong %5
- %22 = OpLoad %uint %6
- %27 = OpConvertUToPtr %_ptr_Generic_uint %21
- OpStore %27 %22
+ %22 = OpIAdd %ulong %15 %ulong_4
+ %24 = OpConvertUToPtr %_ptr_Generic_uint %22
+ %14 = OpLoad %uint %24
+ OpStore %7 %14
+ %17 = OpLoad %uint %6
+ %18 = OpLoad %uint %7
+ %16 = OpExtInst %uint %28 s_min %17 %18
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %uint %6
+ %25 = OpConvertUToPtr %_ptr_Generic_uint %19
+ OpStore %25 %20
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/mod.rs b/ptx/src/test/spirv_run/mod.rs
index 7ba3c4d..3fa82ba 100644
--- a/ptx/src/test/spirv_run/mod.rs
+++ b/ptx/src/test/spirv_run/mod.rs
@@ -60,8 +60,7 @@ test_ptx!(call, [1u64], [2u64]);
test_ptx!(vector, [1u32, 2u32], [3u32, 3u32]);
test_ptx!(ld_st_offset, [1u32, 2u32], [2u32, 1u32]);
test_ptx!(ntid, [3u32], [4u32]);
-// TODO: enable test below
-// test_ptx!(reg_local, [12u64], [13u64]);
+test_ptx!(reg_local, [12u64], [13u64]);
test_ptx!(mov_address, [0xDEADu64], [0u64]);
test_ptx!(b64tof64, [111u64], [111u64]);
test_ptx!(implicit_param, [34u32], [34u32]);
@@ -105,6 +104,10 @@ test_ptx!(div_approx, [1f32, 2f32], [0.5f32]);
test_ptx!(sqrt, [0.25f32], [0.5f32]);
test_ptx!(rsqrt, [0.25f64], [2f64]);
test_ptx!(neg, [181i32], [-181i32]);
+test_ptx!(sin, [std::f32::consts::PI/2f32], [1f32]);
+test_ptx!(cos, [std::f32::consts::PI], [-1f32]);
+test_ptx!(lg2, [512f32], [9f32]);
+test_ptx!(ex2, [10f32], [1024f32]);
struct DisplayError<T: Debug> {
err: T,
diff --git a/ptx/src/test/spirv_run/mov.spvtxt b/ptx/src/test/spirv_run/mov.spvtxt
index d8a5029..15118aa 100644
--- a/ptx/src/test/spirv_run/mov.spvtxt
+++ b/ptx/src/test/spirv_run/mov.spvtxt
@@ -2,20 +2,23 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %24 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %22 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "mov"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %27 = OpTypeFunction %void %ulong %ulong
+ %25 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %27
+ %1 = OpFunction %void None %25
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %22 = OpLabel
+ %20 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -24,22 +27,20 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %20 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %20
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %16 = OpCopyObject %ulong %17
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %21 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %21 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %18 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %18
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %14 = OpCopyObject %ulong %15
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %19 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %19 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/mul_hi.spvtxt b/ptx/src/test/spirv_run/mul_hi.spvtxt
index bea23a9..8449183 100644
--- a/ptx/src/test/spirv_run/mul_hi.spvtxt
+++ b/ptx/src/test/spirv_run/mul_hi.spvtxt
@@ -2,21 +2,24 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %25 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %23 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "mul_hi"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %28 = OpTypeFunction %void %ulong %ulong
+ %26 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_2 = OpConstant %ulong 2
- %1 = OpFunction %void None %28
+ %1 = OpFunction %void None %26
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %23 = OpLabel
+ %21 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -25,22 +28,20 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %21 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %21
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %16 = OpExtInst %ulong %25 u_mul_hi %17 %ulong_2
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %22 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %22 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %19 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %19
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %14 = OpExtInst %ulong %23 u_mul_hi %15 %ulong_2
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %20 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %20 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/mul_lo.spvtxt b/ptx/src/test/spirv_run/mul_lo.spvtxt
index e114374..d4b2566 100644
--- a/ptx/src/test/spirv_run/mul_lo.spvtxt
+++ b/ptx/src/test/spirv_run/mul_lo.spvtxt
@@ -2,21 +2,24 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %25 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %23 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "mul_lo"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %28 = OpTypeFunction %void %ulong %ulong
+ %26 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_2 = OpConstant %ulong 2
- %1 = OpFunction %void None %28
+ %1 = OpFunction %void None %26
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %23 = OpLabel
+ %21 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -25,22 +28,20 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %21 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %21
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %16 = OpIMul %ulong %17 %ulong_2
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %22 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %22 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %19 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %19
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %14 = OpIMul %ulong %15 %ulong_2
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %20 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %20 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/mul_non_ftz.spvtxt b/ptx/src/test/spirv_run/mul_non_ftz.spvtxt
index 78153aa..cb20943 100644
--- a/ptx/src/test/spirv_run/mul_non_ftz.spvtxt
+++ b/ptx/src/test/spirv_run/mul_non_ftz.spvtxt
@@ -7,25 +7,21 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- OpCapability DenormFlushToZero
- OpCapability DenormPreserve
- OpExtension "SPV_KHR_float_controls"
- %30 = OpExtInstImport "OpenCL.std"
+ %28 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "mul_non_ftz"
- OpExecutionMode %1 DenormPreserve 32
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %33 = OpTypeFunction %void %ulong %ulong
+ %31 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%float = OpTypeFloat 32
%_ptr_Function_float = OpTypePointer Function %float
%_ptr_Generic_float = OpTypePointer Generic %float
%ulong_4 = OpConstant %ulong 4
- %1 = OpFunction %void None %33
+ %1 = OpFunction %void None %31
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %28 = OpLabel
+ %26 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -34,28 +30,26 @@
%7 = OpVariable %_ptr_Function_float Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_float %13
+ %12 = OpLoad %float %23
+ OpStore %6 %12
%15 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_Generic_float %15
- %14 = OpLoad %float %25
- OpStore %6 %14
- %17 = OpLoad %ulong %4
- %24 = OpIAdd %ulong %17 %ulong_4
- %26 = OpConvertUToPtr %_ptr_Generic_float %24
- %16 = OpLoad %float %26
- OpStore %7 %16
- %19 = OpLoad %float %6
- %20 = OpLoad %float %7
- %18 = OpFMul %float %19 %20
- OpStore %6 %18
- %21 = OpLoad %ulong %5
- %22 = OpLoad %float %6
- %27 = OpConvertUToPtr %_ptr_Generic_float %21
- OpStore %27 %22
+ %22 = OpIAdd %ulong %15 %ulong_4
+ %24 = OpConvertUToPtr %_ptr_Generic_float %22
+ %14 = OpLoad %float %24
+ OpStore %7 %14
+ %17 = OpLoad %float %6
+ %18 = OpLoad %float %7
+ %16 = OpFMul %float %17 %18
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %float %6
+ %25 = OpConvertUToPtr %_ptr_Generic_float %19
+ OpStore %25 %20
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/mul_wide.spvtxt b/ptx/src/test/spirv_run/mul_wide.spvtxt
index 8ac0459..632fa3b 100644
--- a/ptx/src/test/spirv_run/mul_wide.spvtxt
+++ b/ptx/src/test/spirv_run/mul_wide.spvtxt
@@ -7,24 +7,24 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %32 = OpExtInstImport "OpenCL.std"
+ %30 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "mul_wide"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %35 = OpTypeFunction %void %ulong %ulong
+ %33 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_CrossWorkgroup_uint = OpTypePointer CrossWorkgroup %uint
%ulong_4 = OpConstant %ulong 4
- %_struct_40 = OpTypeStruct %uint %uint
+ %_struct_38 = OpTypeStruct %uint %uint
%v2uint = OpTypeVector %uint 2
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %35
+ %1 = OpFunction %void None %33
%9 = OpFunctionParameter %ulong
%10 = OpFunctionParameter %ulong
- %30 = OpLabel
+ %28 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -34,33 +34,31 @@
%8 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %9
OpStore %3 %10
- %12 = OpLoad %ulong %2
- %11 = OpCopyObject %ulong %12
+ %11 = OpLoad %ulong %2
OpStore %4 %11
- %14 = OpLoad %ulong %3
- %13 = OpCopyObject %ulong %14
- OpStore %5 %13
+ %12 = OpLoad %ulong %3
+ OpStore %5 %12
+ %14 = OpLoad %ulong %4
+ %24 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %14
+ %13 = OpLoad %uint %24
+ OpStore %6 %13
%16 = OpLoad %ulong %4
- %26 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %16
- %15 = OpLoad %uint %26
- OpStore %6 %15
- %18 = OpLoad %ulong %4
- %25 = OpIAdd %ulong %18 %ulong_4
- %27 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %25
- %17 = OpLoad %uint %27
- OpStore %7 %17
- %20 = OpLoad %uint %6
- %21 = OpLoad %uint %7
- %41 = OpSMulExtended %_struct_40 %20 %21
- %42 = OpCompositeExtract %uint %41 0
- %43 = OpCompositeExtract %uint %41 1
- %45 = OpCompositeConstruct %v2uint %42 %43
- %19 = OpBitcast %ulong %45
- OpStore %8 %19
- %22 = OpLoad %ulong %5
- %23 = OpLoad %ulong %8
- %28 = OpConvertUToPtr %_ptr_Generic_ulong %22
- %29 = OpCopyObject %ulong %23
- OpStore %28 %29
+ %23 = OpIAdd %ulong %16 %ulong_4
+ %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_uint %23
+ %15 = OpLoad %uint %25
+ OpStore %7 %15
+ %18 = OpLoad %uint %6
+ %19 = OpLoad %uint %7
+ %39 = OpSMulExtended %_struct_38 %18 %19
+ %40 = OpCompositeExtract %uint %39 0
+ %41 = OpCompositeExtract %uint %39 1
+ %43 = OpCompositeConstruct %v2uint %40 %41
+ %17 = OpBitcast %ulong %43
+ OpStore %8 %17
+ %20 = OpLoad %ulong %5
+ %21 = OpLoad %ulong %8
+ %26 = OpConvertUToPtr %_ptr_Generic_ulong %20
+ %27 = OpCopyObject %ulong %21
+ OpStore %26 %27
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/neg.spvtxt b/ptx/src/test/spirv_run/neg.spvtxt
index b358858..50726aa 100644
--- a/ptx/src/test/spirv_run/neg.spvtxt
+++ b/ptx/src/test/spirv_run/neg.spvtxt
@@ -2,46 +2,46 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %26 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
- OpEntryPoint Kernel %1 "not"
+ OpEntryPoint Kernel %1 "neg"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %29 = OpTypeFunction %void %ulong %ulong
+ %24 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
-%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %29
+ %uint = OpTypeInt 32 0
+%_ptr_Function_uint = OpTypePointer Function %uint
+%_ptr_Generic_uint = OpTypePointer Generic %uint
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
%8 = OpFunctionParameter %ulong
- %9 = OpFunctionParameter %ulong
- %24 = OpLabel
+ %19 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
%5 = OpVariable %_ptr_Function_ulong Function
- %6 = OpVariable %_ptr_Function_ulong Function
- %7 = OpVariable %_ptr_Function_ulong Function
- OpStore %2 %8
- OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
- OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %20 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %20
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %22 = OpCopyObject %ulong %17
- %21 = OpNot %ulong %22
- %16 = OpCopyObject %ulong %21
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %23 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %23 %19
+ %6 = OpVariable %_ptr_Function_uint Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_uint %12
+ %11 = OpLoad %uint %17
+ OpStore %6 %11
+ %14 = OpLoad %uint %6
+ %13 = OpSNegate %uint %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %uint %6
+ %18 = OpConvertUToPtr %_ptr_Generic_uint %15
+ OpStore %18 %16
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/not.spvtxt b/ptx/src/test/spirv_run/not.spvtxt
index b358858..d6bc389 100644
--- a/ptx/src/test/spirv_run/not.spvtxt
+++ b/ptx/src/test/spirv_run/not.spvtxt
@@ -2,20 +2,23 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %26 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %24 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "not"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %29 = OpTypeFunction %void %ulong %ulong
+ %27 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
- %1 = OpFunction %void None %29
+ %1 = OpFunction %void None %27
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %24 = OpLabel
+ %22 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -24,24 +27,22 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %20 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %20
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %22 = OpCopyObject %ulong %17
- %21 = OpNot %ulong %22
- %16 = OpCopyObject %ulong %21
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %23 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %23 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %18 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %18
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %20 = OpCopyObject %ulong %15
+ %19 = OpNot %ulong %20
+ %14 = OpCopyObject %ulong %19
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %21 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %21 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/ntid.spvtxt b/ptx/src/test/spirv_run/ntid.spvtxt
index be16d2e..d1a3caa 100644
--- a/ptx/src/test/spirv_run/ntid.spvtxt
+++ b/ptx/src/test/spirv_run/ntid.spvtxt
@@ -2,10 +2,12 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
OpCapability Float64
- %29 = OpExtInstImport "OpenCL.std"
+ %27 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "ntid" %gl_WorkGroupSize
OpDecorate %gl_WorkGroupSize BuiltIn WorkgroupSize
@@ -15,14 +17,14 @@
%_ptr_UniformConstant_v4uint = OpTypePointer UniformConstant %v4uint
%gl_WorkGroupSize = OpVariable %_ptr_UniformConstant_v4uint UniformConstant
%ulong = OpTypeInt 64 0
- %35 = OpTypeFunction %void %ulong %ulong
+ %33 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_Generic_uint = OpTypePointer Generic %uint
- %1 = OpFunction %void None %35
+ %1 = OpFunction %void None %33
%9 = OpFunctionParameter %ulong
%10 = OpFunctionParameter %ulong
- %27 = OpLabel
+ %25 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -31,27 +33,25 @@
%7 = OpVariable %_ptr_Function_uint Function
OpStore %2 %9
OpStore %3 %10
- %12 = OpLoad %ulong %2
- %11 = OpCopyObject %ulong %12
+ %11 = OpLoad %ulong %2
OpStore %4 %11
- %14 = OpLoad %ulong %3
- %13 = OpCopyObject %ulong %14
- OpStore %5 %13
- %16 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_Generic_uint %16
- %15 = OpLoad %uint %25
- OpStore %6 %15
- %18 = OpLoad %v4uint %gl_WorkGroupSize
- %24 = OpCompositeExtract %uint %18 0
- %17 = OpCopyObject %uint %24
- OpStore %7 %17
- %20 = OpLoad %uint %6
- %21 = OpLoad %uint %7
- %19 = OpIAdd %uint %20 %21
- OpStore %6 %19
- %22 = OpLoad %ulong %5
- %23 = OpLoad %uint %6
- %26 = OpConvertUToPtr %_ptr_Generic_uint %22
- OpStore %26 %23
+ %12 = OpLoad %ulong %3
+ OpStore %5 %12
+ %14 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_uint %14
+ %13 = OpLoad %uint %23
+ OpStore %6 %13
+ %16 = OpLoad %v4uint %gl_WorkGroupSize
+ %22 = OpCompositeExtract %uint %16 0
+ %15 = OpCopyObject %uint %22
+ OpStore %7 %15
+ %18 = OpLoad %uint %6
+ %19 = OpLoad %uint %7
+ %17 = OpIAdd %uint %18 %19
+ OpStore %6 %17
+ %20 = OpLoad %ulong %5
+ %21 = OpLoad %uint %6
+ %24 = OpConvertUToPtr %_ptr_Generic_uint %20
+ OpStore %24 %21
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/or.spvtxt b/ptx/src/test/spirv_run/or.spvtxt
index fbf80c5..312b1b3 100644
--- a/ptx/src/test/spirv_run/or.spvtxt
+++ b/ptx/src/test/spirv_run/or.spvtxt
@@ -7,19 +7,19 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %33 = OpExtInstImport "OpenCL.std"
+ %31 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "or"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %36 = OpTypeFunction %void %ulong %ulong
+ %34 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_8 = OpConstant %ulong 8
- %1 = OpFunction %void None %36
+ %1 = OpFunction %void None %34
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %31 = OpLabel
+ %29 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -28,31 +28,29 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %23 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %23
+ OpStore %6 %12
%15 = OpLoad %ulong %4
- %25 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %25
- OpStore %6 %14
- %17 = OpLoad %ulong %4
- %24 = OpIAdd %ulong %17 %ulong_8
- %26 = OpConvertUToPtr %_ptr_Generic_ulong %24
- %16 = OpLoad %ulong %26
- OpStore %7 %16
- %19 = OpLoad %ulong %6
- %20 = OpLoad %ulong %7
- %28 = OpCopyObject %ulong %19
- %29 = OpCopyObject %ulong %20
- %27 = OpBitwiseOr %ulong %28 %29
- %18 = OpCopyObject %ulong %27
- OpStore %6 %18
- %21 = OpLoad %ulong %5
- %22 = OpLoad %ulong %6
- %30 = OpConvertUToPtr %_ptr_Generic_ulong %21
- OpStore %30 %22
+ %22 = OpIAdd %ulong %15 %ulong_8
+ %24 = OpConvertUToPtr %_ptr_Generic_ulong %22
+ %14 = OpLoad %ulong %24
+ OpStore %7 %14
+ %17 = OpLoad %ulong %6
+ %18 = OpLoad %ulong %7
+ %26 = OpCopyObject %ulong %17
+ %27 = OpCopyObject %ulong %18
+ %25 = OpBitwiseOr %ulong %26 %27
+ %16 = OpCopyObject %ulong %25
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %ulong %6
+ %28 = OpConvertUToPtr %_ptr_Generic_ulong %19
+ OpStore %28 %20
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/pred_not.spvtxt b/ptx/src/test/spirv_run/pred_not.spvtxt
index 410b1e4..178c98f 100644
--- a/ptx/src/test/spirv_run/pred_not.spvtxt
+++ b/ptx/src/test/spirv_run/pred_not.spvtxt
@@ -2,15 +2,17 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
OpCapability Float64
- %44 = OpExtInstImport "OpenCL.std"
+ %42 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "pred_not"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %47 = OpTypeFunction %void %ulong %ulong
+ %45 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%bool = OpTypeBool
%_ptr_Function_bool = OpTypePointer Function %bool
@@ -20,10 +22,10 @@
%false = OpConstantFalse %bool
%ulong_1 = OpConstant %ulong 1
%ulong_2 = OpConstant %ulong 2
- %1 = OpFunction %void None %47
+ %1 = OpFunction %void None %45
%14 = OpFunctionParameter %ulong
%15 = OpFunctionParameter %ulong
- %42 = OpLabel
+ %40 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -34,45 +36,43 @@
%9 = OpVariable %_ptr_Function_bool Function
OpStore %2 %14
OpStore %3 %15
- %17 = OpLoad %ulong %2
- %16 = OpCopyObject %ulong %17
+ %16 = OpLoad %ulong %2
OpStore %4 %16
- %19 = OpLoad %ulong %3
- %18 = OpCopyObject %ulong %19
- OpStore %5 %18
+ %17 = OpLoad %ulong %3
+ OpStore %5 %17
+ %19 = OpLoad %ulong %4
+ %37 = OpConvertUToPtr %_ptr_Generic_ulong %19
+ %18 = OpLoad %ulong %37
+ OpStore %6 %18
%21 = OpLoad %ulong %4
- %39 = OpConvertUToPtr %_ptr_Generic_ulong %21
- %20 = OpLoad %ulong %39
- OpStore %6 %20
- %23 = OpLoad %ulong %4
- %36 = OpIAdd %ulong %23 %ulong_8
- %40 = OpConvertUToPtr %_ptr_Generic_ulong %36
- %22 = OpLoad %ulong %40
- OpStore %7 %22
- %25 = OpLoad %ulong %6
- %26 = OpLoad %ulong %7
- %24 = OpULessThan %bool %25 %26
- OpStore %9 %24
- %28 = OpLoad %bool %9
- %27 = OpSelect %bool %28 %false %true
- OpStore %9 %27
- %29 = OpLoad %bool %9
- OpBranchConditional %29 %10 %11
+ %34 = OpIAdd %ulong %21 %ulong_8
+ %38 = OpConvertUToPtr %_ptr_Generic_ulong %34
+ %20 = OpLoad %ulong %38
+ OpStore %7 %20
+ %23 = OpLoad %ulong %6
+ %24 = OpLoad %ulong %7
+ %22 = OpULessThan %bool %23 %24
+ OpStore %9 %22
+ %26 = OpLoad %bool %9
+ %25 = OpSelect %bool %26 %false %true
+ OpStore %9 %25
+ %27 = OpLoad %bool %9
+ OpBranchConditional %27 %10 %11
%10 = OpLabel
- %30 = OpCopyObject %ulong %ulong_1
- OpStore %8 %30
+ %28 = OpCopyObject %ulong %ulong_1
+ OpStore %8 %28
OpBranch %11
%11 = OpLabel
- %31 = OpLoad %bool %9
- OpBranchConditional %31 %13 %12
+ %29 = OpLoad %bool %9
+ OpBranchConditional %29 %13 %12
%12 = OpLabel
- %32 = OpCopyObject %ulong %ulong_2
- OpStore %8 %32
+ %30 = OpCopyObject %ulong %ulong_2
+ OpStore %8 %30
OpBranch %13
%13 = OpLabel
- %33 = OpLoad %ulong %5
- %34 = OpLoad %ulong %8
- %41 = OpConvertUToPtr %_ptr_Generic_ulong %33
- OpStore %41 %34
+ %31 = OpLoad %ulong %5
+ %32 = OpLoad %ulong %8
+ %39 = OpConvertUToPtr %_ptr_Generic_ulong %31
+ OpStore %39 %32
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/rcp.spvtxt b/ptx/src/test/spirv_run/rcp.spvtxt
index fd10ff1..0ce2d75 100644
--- a/ptx/src/test/spirv_run/rcp.spvtxt
+++ b/ptx/src/test/spirv_run/rcp.spvtxt
@@ -7,24 +7,22 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- OpExtension "SPV_KHR_float_controls"
- %23 = OpExtInstImport "OpenCL.std"
+ %21 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "rcp"
- OpExecutionMode %1 DenormPreserve 32
- OpDecorate %15 FPFastMathMode AllowRecip
+ OpDecorate %13 FPFastMathMode AllowRecip
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %26 = OpTypeFunction %void %ulong %ulong
+ %24 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%float = OpTypeFloat 32
%_ptr_Function_float = OpTypePointer Function %float
%_ptr_Generic_float = OpTypePointer Generic %float
%float_1 = OpConstant %float 1
- %1 = OpFunction %void None %26
+ %1 = OpFunction %void None %24
%7 = OpFunctionParameter %ulong
%8 = OpFunctionParameter %ulong
- %21 = OpLabel
+ %19 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -32,22 +30,20 @@
%6 = OpVariable %_ptr_Function_float Function
OpStore %2 %7
OpStore %3 %8
- %10 = OpLoad %ulong %2
- %9 = OpCopyObject %ulong %10
+ %9 = OpLoad %ulong %2
OpStore %4 %9
- %12 = OpLoad %ulong %3
- %11 = OpCopyObject %ulong %12
- OpStore %5 %11
- %14 = OpLoad %ulong %4
- %19 = OpConvertUToPtr %_ptr_Generic_float %14
- %13 = OpLoad %float %19
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %17
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpFDiv %float %float_1 %14
OpStore %6 %13
+ %15 = OpLoad %ulong %5
%16 = OpLoad %float %6
- %15 = OpFDiv %float %float_1 %16
- OpStore %6 %15
- %17 = OpLoad %ulong %5
- %18 = OpLoad %float %6
- %20 = OpConvertUToPtr %_ptr_Generic_float %17
- OpStore %20 %18
+ %18 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %18 %16
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/reg_local.ptx b/ptx/src/test/spirv_run/reg_local.ptx
index f09b95a..5707cea 100644
--- a/ptx/src/test/spirv_run/reg_local.ptx
+++ b/ptx/src/test/spirv_run/reg_local.ptx
@@ -11,14 +11,13 @@
.reg .u64 in_addr;
.reg .u64 out_addr;
.reg .b64 temp;
- .reg .s64 unused;
ld.param.u64 in_addr, [input];
ld.param.u64 out_addr, [output];
ld.global.u64 temp, [in_addr];
st.u64 [local_x], temp + 1;
- ld.u64 temp, [local_x];
- st.global.u64 [out_addr], temp;
+ ld.u64 temp, [local_x+0];
+ st.global.u64 [out_addr+0], temp;
ret;
} \ No newline at end of file
diff --git a/ptx/src/test/spirv_run/reg_local.spvtxt b/ptx/src/test/spirv_run/reg_local.spvtxt
index 2d6bd08..596cedc 100644
--- a/ptx/src/test/spirv_run/reg_local.spvtxt
+++ b/ptx/src/test/spirv_run/reg_local.spvtxt
@@ -2,62 +2,66 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %35 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %34 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "reg_local"
OpDecorate %4 Alignment 8
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %38 = OpTypeFunction %void %ulong %ulong
+ %37 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
- %uchar = OpTypeInt 8 0
%uint = OpTypeInt 32 0
+ %uchar = OpTypeInt 8 0
%uint_8 = OpConstant %uint 8
%_arr_uchar_uint_8 = OpTypeArray %uchar %uint_8
%_ptr_Function__arr_uchar_uint_8 = OpTypePointer Function %_arr_uchar_uint_8
%_ptr_CrossWorkgroup_ulong = OpTypePointer CrossWorkgroup %ulong
%ulong_1 = OpConstant %ulong 1
- %1 = OpFunction %void None %38
+ %ulong_0 = OpConstant %ulong 0
+ %ulong_0_0 = OpConstant %ulong 0
+ %1 = OpFunction %void None %37
+ %8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %10 = OpFunctionParameter %ulong
- %33 = OpLabel
+ %32 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function__arr_uchar_uint_8 Function
%5 = OpVariable %_ptr_Function_ulong Function
%6 = OpVariable %_ptr_Function_ulong Function
%7 = OpVariable %_ptr_Function_ulong Function
- %8 = OpVariable %_ptr_Function_ulong Function
- OpStore %2 %9
- OpStore %3 %10
- %12 = OpLoad %ulong %2
- %11 = OpCopyObject %ulong %12
- OpStore %5 %11
- %14 = OpLoad %ulong %3
- %13 = OpCopyObject %ulong %14
- OpStore %6 %13
- %16 = OpLoad %ulong %5
- %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %16
- %26 = OpLoad %ulong %25
- %15 = OpCopyObject %ulong %26
+ OpStore %2 %8
+ OpStore %3 %9
+ %10 = OpLoad %ulong %2
+ OpStore %5 %10
+ %11 = OpLoad %ulong %3
+ OpStore %6 %11
+ %13 = OpLoad %ulong %5
+ %25 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %13
+ %24 = OpLoad %ulong %25
+ %12 = OpCopyObject %ulong %24
+ OpStore %7 %12
+ %14 = OpLoad %ulong %7
+ %26 = OpCopyObject %ulong %14
+ %19 = OpIAdd %ulong %26 %ulong_1
+ %27 = OpBitcast %_ptr_Function_ulong %4
+ OpStore %27 %19
+ %28 = OpBitcast %_ptr_Function_ulong %4
+ %45 = OpBitcast %ulong %28
+ %46 = OpIAdd %ulong %45 %ulong_0
+ %21 = OpBitcast %_ptr_Function_ulong %46
+ %29 = OpLoad %ulong %21
+ %15 = OpCopyObject %ulong %29
OpStore %7 %15
- %18 = OpLoad %ulong %7
- %27 = OpCopyObject %ulong %18
- %24 = OpIAdd %ulong %27 %ulong_1
- %28 = OpCopyObject %ulong %24
- %17 = OpBitcast %ulong %28
- OpStore %4 %17
- %20 = OpLoad %_arr_uchar_uint_8 %4
- %29 = OpBitcast %ulong %20
- %30 = OpCopyObject %ulong %29
- %19 = OpCopyObject %ulong %30
- OpStore %7 %19
- %21 = OpLoad %ulong %6
- %22 = OpLoad %ulong %7
- %31 = OpCopyObject %ulong %22
- %32 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %21
- OpStore %32 %31
+ %16 = OpLoad %ulong %6
+ %17 = OpLoad %ulong %7
+ %23 = OpIAdd %ulong %16 %ulong_0_0
+ %30 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %23
+ %31 = OpCopyObject %ulong %17
+ OpStore %30 %31
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/rsqrt.spvtxt b/ptx/src/test/spirv_run/rsqrt.spvtxt
index 5c3ba97..ed473bc 100644
--- a/ptx/src/test/spirv_run/rsqrt.spvtxt
+++ b/ptx/src/test/spirv_run/rsqrt.spvtxt
@@ -1,56 +1,47 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 31
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%23 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "rsqrt"
-OpDecorate %1 FunctionDenormModeINTEL 64 Preserve
-%24 = OpTypeVoid
-%25 = OpTypeInt 64 0
-%26 = OpTypeFunction %24 %25 %25
-%27 = OpTypePointer Function %25
-%28 = OpTypeFloat 64
-%29 = OpTypePointer Function %28
-%30 = OpTypePointer Generic %28
-%1 = OpFunction %24 None %26
-%7 = OpFunctionParameter %25
-%8 = OpFunctionParameter %25
-%21 = OpLabel
-%2 = OpVariable %27 Function
-%3 = OpVariable %27 Function
-%4 = OpVariable %27 Function
-%5 = OpVariable %27 Function
-%6 = OpVariable %29 Function
-OpStore %2 %7
-OpStore %3 %8
-%10 = OpLoad %25 %2
-%9 = OpCopyObject %25 %10
-OpStore %4 %9
-%12 = OpLoad %25 %3
-%11 = OpCopyObject %25 %12
-OpStore %5 %11
-%14 = OpLoad %25 %4
-%19 = OpConvertUToPtr %30 %14
-%13 = OpLoad %28 %19
-OpStore %6 %13
-%16 = OpLoad %28 %6
-%15 = OpExtInst %28 %23 native_rsqrt %16
-OpStore %6 %15
-%17 = OpLoad %25 %5
-%18 = OpLoad %28 %6
-%20 = OpConvertUToPtr %30 %17
-OpStore %20 %18
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "rsqrt"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %24 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %double = OpTypeFloat 64
+%_ptr_Function_double = OpTypePointer Function %double
+%_ptr_Generic_double = OpTypePointer Generic %double
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %19 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_double Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_double %12
+ %11 = OpLoad %double %17
+ OpStore %6 %11
+ %14 = OpLoad %double %6
+ %13 = OpExtInst %double %21 native_rsqrt %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %double %6
+ %18 = OpConvertUToPtr %_ptr_Generic_double %15
+ OpStore %18 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/selp.spvtxt b/ptx/src/test/spirv_run/selp.spvtxt
index 6f73bc2..44e87e4 100644
--- a/ptx/src/test/spirv_run/selp.spvtxt
+++ b/ptx/src/test/spirv_run/selp.spvtxt
@@ -1,65 +1,57 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 40
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%31 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "selp"
-%32 = OpTypeVoid
-%33 = OpTypeInt 64 0
-%34 = OpTypeFunction %32 %33 %33
-%35 = OpTypePointer Function %33
-%36 = OpTypeInt 16 0
-%37 = OpTypePointer Function %36
-%38 = OpTypePointer Generic %36
-%23 = OpConstant %33 2
-%39 = OpTypeBool
-%25 = OpConstantFalse %39
-%1 = OpFunction %32 None %34
-%8 = OpFunctionParameter %33
-%9 = OpFunctionParameter %33
-%29 = OpLabel
-%2 = OpVariable %35 Function
-%3 = OpVariable %35 Function
-%4 = OpVariable %35 Function
-%5 = OpVariable %35 Function
-%6 = OpVariable %37 Function
-%7 = OpVariable %37 Function
-OpStore %2 %8
-OpStore %3 %9
-%11 = OpLoad %33 %2
-%10 = OpCopyObject %33 %11
-OpStore %4 %10
-%13 = OpLoad %33 %3
-%12 = OpCopyObject %33 %13
-OpStore %5 %12
-%15 = OpLoad %33 %4
-%26 = OpConvertUToPtr %38 %15
-%14 = OpLoad %36 %26
-OpStore %6 %14
-%17 = OpLoad %33 %4
-%24 = OpIAdd %33 %17 %23
-%27 = OpConvertUToPtr %38 %24
-%16 = OpLoad %36 %27
-OpStore %7 %16
-%19 = OpLoad %36 %6
-%20 = OpLoad %36 %7
-%18 = OpSelect %36 %25 %20 %20
-OpStore %6 %18
-%21 = OpLoad %33 %5
-%22 = OpLoad %36 %6
-%28 = OpConvertUToPtr %38 %21
-OpStore %28 %22
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %29 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "selp"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %32 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %ushort = OpTypeInt 16 0
+%_ptr_Function_ushort = OpTypePointer Function %ushort
+%_ptr_Generic_ushort = OpTypePointer Generic %ushort
+ %ulong_2 = OpConstant %ulong 2
+ %bool = OpTypeBool
+ %false = OpConstantFalse %bool
+ %1 = OpFunction %void None %32
+ %8 = OpFunctionParameter %ulong
+ %9 = OpFunctionParameter %ulong
+ %27 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_ushort Function
+ %7 = OpVariable %_ptr_Function_ushort Function
+ OpStore %2 %8
+ OpStore %3 %9
+ %10 = OpLoad %ulong %2
+ OpStore %4 %10
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %24 = OpConvertUToPtr %_ptr_Generic_ushort %13
+ %12 = OpLoad %ushort %24
+ OpStore %6 %12
+ %15 = OpLoad %ulong %4
+ %22 = OpIAdd %ulong %15 %ulong_2
+ %25 = OpConvertUToPtr %_ptr_Generic_ushort %22
+ %14 = OpLoad %ushort %25
+ OpStore %7 %14
+ %17 = OpLoad %ushort %6
+ %18 = OpLoad %ushort %7
+ %16 = OpSelect %ushort %false %18 %18
+ OpStore %6 %16
+ %19 = OpLoad %ulong %5
+ %20 = OpLoad %ushort %6
+ %26 = OpConvertUToPtr %_ptr_Generic_ushort %19
+ OpStore %26 %20
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/setp.spvtxt b/ptx/src/test/spirv_run/setp.spvtxt
index 5e18377..ec94573 100644
--- a/ptx/src/test/spirv_run/setp.spvtxt
+++ b/ptx/src/test/spirv_run/setp.spvtxt
@@ -2,14 +2,17 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %42 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %40 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "setp"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %45 = OpTypeFunction %void %ulong %ulong
+ %43 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%bool = OpTypeBool
%_ptr_Function_bool = OpTypePointer Function %bool
@@ -17,10 +20,10 @@
%ulong_8 = OpConstant %ulong 8
%ulong_1 = OpConstant %ulong 1
%ulong_2 = OpConstant %ulong 2
- %1 = OpFunction %void None %45
+ %1 = OpFunction %void None %43
%14 = OpFunctionParameter %ulong
%15 = OpFunctionParameter %ulong
- %40 = OpLabel
+ %38 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -31,42 +34,40 @@
%9 = OpVariable %_ptr_Function_bool Function
OpStore %2 %14
OpStore %3 %15
- %17 = OpLoad %ulong %2
- %16 = OpCopyObject %ulong %17
+ %16 = OpLoad %ulong %2
OpStore %4 %16
- %19 = OpLoad %ulong %3
- %18 = OpCopyObject %ulong %19
- OpStore %5 %18
+ %17 = OpLoad %ulong %3
+ OpStore %5 %17
+ %19 = OpLoad %ulong %4
+ %35 = OpConvertUToPtr %_ptr_Generic_ulong %19
+ %18 = OpLoad %ulong %35
+ OpStore %6 %18
%21 = OpLoad %ulong %4
- %37 = OpConvertUToPtr %_ptr_Generic_ulong %21
- %20 = OpLoad %ulong %37
- OpStore %6 %20
- %23 = OpLoad %ulong %4
- %34 = OpIAdd %ulong %23 %ulong_8
- %38 = OpConvertUToPtr %_ptr_Generic_ulong %34
- %22 = OpLoad %ulong %38
- OpStore %7 %22
- %25 = OpLoad %ulong %6
- %26 = OpLoad %ulong %7
- %24 = OpULessThan %bool %25 %26
- OpStore %9 %24
- %27 = OpLoad %bool %9
- OpBranchConditional %27 %10 %11
+ %32 = OpIAdd %ulong %21 %ulong_8
+ %36 = OpConvertUToPtr %_ptr_Generic_ulong %32
+ %20 = OpLoad %ulong %36
+ OpStore %7 %20
+ %23 = OpLoad %ulong %6
+ %24 = OpLoad %ulong %7
+ %22 = OpULessThan %bool %23 %24
+ OpStore %9 %22
+ %25 = OpLoad %bool %9
+ OpBranchConditional %25 %10 %11
%10 = OpLabel
- %28 = OpCopyObject %ulong %ulong_1
- OpStore %8 %28
+ %26 = OpCopyObject %ulong %ulong_1
+ OpStore %8 %26
OpBranch %11
%11 = OpLabel
- %29 = OpLoad %bool %9
- OpBranchConditional %29 %13 %12
+ %27 = OpLoad %bool %9
+ OpBranchConditional %27 %13 %12
%12 = OpLabel
- %30 = OpCopyObject %ulong %ulong_2
- OpStore %8 %30
+ %28 = OpCopyObject %ulong %ulong_2
+ OpStore %8 %28
OpBranch %13
%13 = OpLabel
- %31 = OpLoad %ulong %5
- %32 = OpLoad %ulong %8
- %39 = OpConvertUToPtr %_ptr_Generic_ulong %31
- OpStore %39 %32
+ %29 = OpLoad %ulong %5
+ %30 = OpLoad %ulong %8
+ %37 = OpConvertUToPtr %_ptr_Generic_ulong %29
+ OpStore %37 %30
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/shared_ptr_32.spvtxt b/ptx/src/test/spirv_run/shared_ptr_32.spvtxt
index 609cc0e..98e2501 100644
--- a/ptx/src/test/spirv_run/shared_ptr_32.spvtxt
+++ b/ptx/src/test/spirv_run/shared_ptr_32.spvtxt
@@ -1,74 +1,66 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 47
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%34 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "shared_ptr_32" %4
-OpDecorate %4 Alignment 4
-%35 = OpTypeVoid
-%36 = OpTypeInt 32 0
-%37 = OpTypeInt 8 0
-%38 = OpConstant %36 128
-%39 = OpTypeArray %37 %38
-%40 = OpTypePointer Workgroup %39
-%4 = OpVariable %40 Workgroup
-%41 = OpTypeInt 64 0
-%42 = OpTypeFunction %35 %41 %41
-%43 = OpTypePointer Function %41
-%44 = OpTypePointer Function %36
-%45 = OpTypePointer CrossWorkgroup %41
-%46 = OpTypePointer Workgroup %41
-%25 = OpConstant %36 0
-%1 = OpFunction %35 None %42
-%10 = OpFunctionParameter %41
-%11 = OpFunctionParameter %41
-%32 = OpLabel
-%2 = OpVariable %43 Function
-%3 = OpVariable %43 Function
-%5 = OpVariable %43 Function
-%6 = OpVariable %43 Function
-%7 = OpVariable %44 Function
-%8 = OpVariable %43 Function
-%9 = OpVariable %43 Function
-OpStore %2 %10
-OpStore %3 %11
-%13 = OpLoad %41 %2
-%12 = OpCopyObject %41 %13
-OpStore %5 %12
-%15 = OpLoad %41 %3
-%14 = OpCopyObject %41 %15
-OpStore %6 %14
-%27 = OpConvertPtrToU %36 %4
-%16 = OpCopyObject %36 %27
-OpStore %7 %16
-%18 = OpLoad %41 %5
-%28 = OpConvertUToPtr %45 %18
-%17 = OpLoad %41 %28
-OpStore %8 %17
-%19 = OpLoad %36 %7
-%20 = OpLoad %41 %8
-%29 = OpConvertUToPtr %46 %19
-OpStore %29 %20
-%22 = OpLoad %36 %7
-%26 = OpIAdd %36 %22 %25
-%30 = OpConvertUToPtr %46 %26
-%21 = OpLoad %41 %30
-OpStore %9 %21
-%23 = OpLoad %41 %6
-%24 = OpLoad %41 %9
-%31 = OpConvertUToPtr %45 %23
-OpStore %31 %24
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %32 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "shared_ptr_32" %4
+ OpDecorate %4 Alignment 4
+ %void = OpTypeVoid
+ %uint = OpTypeInt 32 0
+ %uchar = OpTypeInt 8 0
+ %uint_128 = OpConstant %uint 128
+%_arr_uchar_uint_128 = OpTypeArray %uchar %uint_128
+%_ptr_Workgroup__arr_uchar_uint_128 = OpTypePointer Workgroup %_arr_uchar_uint_128
+ %4 = OpVariable %_ptr_Workgroup__arr_uchar_uint_128 Workgroup
+ %ulong = OpTypeInt 64 0
+ %40 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+%_ptr_Function_uint = OpTypePointer Function %uint
+%_ptr_CrossWorkgroup_ulong = OpTypePointer CrossWorkgroup %ulong
+%_ptr_Workgroup_ulong = OpTypePointer Workgroup %ulong
+ %uint_0 = OpConstant %uint 0
+ %1 = OpFunction %void None %40
+ %10 = OpFunctionParameter %ulong
+ %11 = OpFunctionParameter %ulong
+ %30 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_ulong Function
+ %7 = OpVariable %_ptr_Function_uint Function
+ %8 = OpVariable %_ptr_Function_ulong Function
+ %9 = OpVariable %_ptr_Function_ulong Function
+ OpStore %2 %10
+ OpStore %3 %11
+ %12 = OpLoad %ulong %2
+ OpStore %5 %12
+ %13 = OpLoad %ulong %3
+ OpStore %6 %13
+ %25 = OpConvertPtrToU %uint %4
+ %14 = OpCopyObject %uint %25
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %26 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %16
+ %15 = OpLoad %ulong %26
+ OpStore %8 %15
+ %17 = OpLoad %uint %7
+ %18 = OpLoad %ulong %8
+ %27 = OpConvertUToPtr %_ptr_Workgroup_ulong %17
+ OpStore %27 %18
+ %20 = OpLoad %uint %7
+ %24 = OpIAdd %uint %20 %uint_0
+ %28 = OpConvertUToPtr %_ptr_Workgroup_ulong %24
+ %19 = OpLoad %ulong %28
+ OpStore %9 %19
+ %21 = OpLoad %ulong %6
+ %22 = OpLoad %ulong %9
+ %29 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %21
+ OpStore %29 %22
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/shared_variable.spvtxt b/ptx/src/test/spirv_run/shared_variable.spvtxt
index 1af2bd1..ffd6bd6 100644
--- a/ptx/src/test/spirv_run/shared_variable.spvtxt
+++ b/ptx/src/test/spirv_run/shared_variable.spvtxt
@@ -1,65 +1,57 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 39
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%27 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "shared_variable" %4
-OpDecorate %4 Alignment 4
-%28 = OpTypeVoid
-%29 = OpTypeInt 32 0
-%30 = OpTypeInt 8 0
-%31 = OpConstant %29 128
-%32 = OpTypeArray %30 %31
-%33 = OpTypePointer Workgroup %32
-%4 = OpVariable %33 Workgroup
-%34 = OpTypeInt 64 0
-%35 = OpTypeFunction %28 %34 %34
-%36 = OpTypePointer Function %34
-%37 = OpTypePointer CrossWorkgroup %34
-%38 = OpTypePointer Workgroup %34
-%1 = OpFunction %28 None %35
-%9 = OpFunctionParameter %34
-%10 = OpFunctionParameter %34
-%25 = OpLabel
-%2 = OpVariable %36 Function
-%3 = OpVariable %36 Function
-%5 = OpVariable %36 Function
-%6 = OpVariable %36 Function
-%7 = OpVariable %36 Function
-%8 = OpVariable %36 Function
-OpStore %2 %9
-OpStore %3 %10
-%12 = OpLoad %34 %2
-%11 = OpCopyObject %34 %12
-OpStore %5 %11
-%14 = OpLoad %34 %3
-%13 = OpCopyObject %34 %14
-OpStore %6 %13
-%16 = OpLoad %34 %5
-%21 = OpConvertUToPtr %37 %16
-%15 = OpLoad %34 %21
-OpStore %7 %15
-%17 = OpLoad %34 %7
-%22 = OpBitcast %38 %4
-OpStore %22 %17
-%23 = OpBitcast %38 %4
-%18 = OpLoad %34 %23
-OpStore %8 %18
-%19 = OpLoad %34 %6
-%20 = OpLoad %34 %8
-%24 = OpConvertUToPtr %37 %19
-OpStore %24 %20
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %25 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "shared_variable" %4
+ OpDecorate %4 Alignment 4
+ %void = OpTypeVoid
+ %uint = OpTypeInt 32 0
+ %uchar = OpTypeInt 8 0
+ %uint_128 = OpConstant %uint 128
+%_arr_uchar_uint_128 = OpTypeArray %uchar %uint_128
+%_ptr_Workgroup__arr_uchar_uint_128 = OpTypePointer Workgroup %_arr_uchar_uint_128
+ %4 = OpVariable %_ptr_Workgroup__arr_uchar_uint_128 Workgroup
+ %ulong = OpTypeInt 64 0
+ %33 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+%_ptr_CrossWorkgroup_ulong = OpTypePointer CrossWorkgroup %ulong
+%_ptr_Workgroup_ulong = OpTypePointer Workgroup %ulong
+ %1 = OpFunction %void None %33
+ %9 = OpFunctionParameter %ulong
+ %10 = OpFunctionParameter %ulong
+ %23 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_ulong Function
+ %7 = OpVariable %_ptr_Function_ulong Function
+ %8 = OpVariable %_ptr_Function_ulong Function
+ OpStore %2 %9
+ OpStore %3 %10
+ %11 = OpLoad %ulong %2
+ OpStore %5 %11
+ %12 = OpLoad %ulong %3
+ OpStore %6 %12
+ %14 = OpLoad %ulong %5
+ %19 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %14
+ %13 = OpLoad %ulong %19
+ OpStore %7 %13
+ %15 = OpLoad %ulong %7
+ %20 = OpBitcast %_ptr_Workgroup_ulong %4
+ OpStore %20 %15
+ %21 = OpBitcast %_ptr_Workgroup_ulong %4
+ %16 = OpLoad %ulong %21
+ OpStore %8 %16
+ %17 = OpLoad %ulong %6
+ %18 = OpLoad %ulong %8
+ %22 = OpConvertUToPtr %_ptr_CrossWorkgroup_ulong %17
+ OpStore %22 %18
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/shl.spvtxt b/ptx/src/test/spirv_run/shl.spvtxt
index 4843a65..ce19fa5 100644
--- a/ptx/src/test/spirv_run/shl.spvtxt
+++ b/ptx/src/test/spirv_run/shl.spvtxt
@@ -2,22 +2,25 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %27 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %25 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "shl"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %30 = OpTypeFunction %void %ulong %ulong
+ %28 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%uint = OpTypeInt 32 0
%uint_2 = OpConstant %uint 2
- %1 = OpFunction %void None %30
+ %1 = OpFunction %void None %28
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %25 = OpLabel
+ %23 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -26,24 +29,22 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %21 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %21
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %23 = OpCopyObject %ulong %17
- %22 = OpShiftLeftLogical %ulong %23 %uint_2
- %16 = OpCopyObject %ulong %22
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %24 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %24 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %19 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %19
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %21 = OpCopyObject %ulong %15
+ %20 = OpShiftLeftLogical %ulong %21 %uint_2
+ %14 = OpCopyObject %ulong %20
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %22 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %22 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/shr.spvtxt b/ptx/src/test/spirv_run/shr.spvtxt
index 417839d..893dbf3 100644
--- a/ptx/src/test/spirv_run/shr.spvtxt
+++ b/ptx/src/test/spirv_run/shr.spvtxt
@@ -7,21 +7,21 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %24 = OpExtInstImport "OpenCL.std"
+ %22 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "shr"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %27 = OpTypeFunction %void %ulong %ulong
+ %25 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%uint = OpTypeInt 32 0
%_ptr_Function_uint = OpTypePointer Function %uint
%_ptr_Generic_uint = OpTypePointer Generic %uint
%uint_1 = OpConstant %uint 1
- %1 = OpFunction %void None %27
+ %1 = OpFunction %void None %25
%7 = OpFunctionParameter %ulong
%8 = OpFunctionParameter %ulong
- %22 = OpLabel
+ %20 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -29,22 +29,20 @@
%6 = OpVariable %_ptr_Function_uint Function
OpStore %2 %7
OpStore %3 %8
- %10 = OpLoad %ulong %2
- %9 = OpCopyObject %ulong %10
+ %9 = OpLoad %ulong %2
OpStore %4 %9
- %12 = OpLoad %ulong %3
- %11 = OpCopyObject %ulong %12
- OpStore %5 %11
- %14 = OpLoad %ulong %4
- %20 = OpConvertUToPtr %_ptr_Generic_uint %14
- %13 = OpLoad %uint %20
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %18 = OpConvertUToPtr %_ptr_Generic_uint %12
+ %11 = OpLoad %uint %18
+ OpStore %6 %11
+ %14 = OpLoad %uint %6
+ %13 = OpShiftRightArithmetic %uint %14 %uint_1
OpStore %6 %13
+ %15 = OpLoad %ulong %5
%16 = OpLoad %uint %6
- %15 = OpShiftRightArithmetic %uint %16 %uint_1
- OpStore %6 %15
- %17 = OpLoad %ulong %5
- %18 = OpLoad %uint %6
- %21 = OpConvertUToPtr %_ptr_Generic_uint %17
- OpStore %21 %18
+ %19 = OpConvertUToPtr %_ptr_Generic_uint %15
+ OpStore %19 %16
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/sin.ptx b/ptx/src/test/spirv_run/sin.ptx
new file mode 100644
index 0000000..fe94cac
--- /dev/null
+++ b/ptx/src/test/spirv_run/sin.ptx
@@ -0,0 +1,21 @@
+.version 6.5
+.target sm_30
+.address_size 64
+
+.visible .entry sin(
+ .param .u64 input,
+ .param .u64 output
+)
+{
+ .reg .u64 in_addr;
+ .reg .u64 out_addr;
+ .reg .f32 temp;
+
+ ld.param.u64 in_addr, [input];
+ ld.param.u64 out_addr, [output];
+
+ ld.f32 temp, [in_addr];
+ sin.approx.f32 temp, temp;
+ st.f32 [out_addr], temp;
+ ret;
+}
diff --git a/ptx/src/test/spirv_run/sin.spvtxt b/ptx/src/test/spirv_run/sin.spvtxt
new file mode 100644
index 0000000..6656a43
--- /dev/null
+++ b/ptx/src/test/spirv_run/sin.spvtxt
@@ -0,0 +1,47 @@
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "sin"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %24 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %19 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %17
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpExtInst %float %21 sin %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %float %6
+ %18 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %18 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/sqrt.spvtxt b/ptx/src/test/spirv_run/sqrt.spvtxt
index d2c5b20..6d1cfd2 100644
--- a/ptx/src/test/spirv_run/sqrt.spvtxt
+++ b/ptx/src/test/spirv_run/sqrt.spvtxt
@@ -1,56 +1,47 @@
-; SPIR-V
-; Version: 1.3
-; Generator: rspirv
-; Bound: 31
-OpCapability GenericPointer
-OpCapability Linkage
-OpCapability Addresses
-OpCapability Kernel
-OpCapability Int8
-OpCapability Int16
-OpCapability Int64
-OpCapability Float16
-OpCapability Float64
-; OpCapability FunctionFloatControlINTEL
-; OpExtension "SPV_INTEL_float_controls2"
-%23 = OpExtInstImport "OpenCL.std"
-OpMemoryModel Physical64 OpenCL
-OpEntryPoint Kernel %1 "sqrt"
-OpDecorate %1 FunctionDenormModeINTEL 32 Preserve
-%24 = OpTypeVoid
-%25 = OpTypeInt 64 0
-%26 = OpTypeFunction %24 %25 %25
-%27 = OpTypePointer Function %25
-%28 = OpTypeFloat 32
-%29 = OpTypePointer Function %28
-%30 = OpTypePointer Generic %28
-%1 = OpFunction %24 None %26
-%7 = OpFunctionParameter %25
-%8 = OpFunctionParameter %25
-%21 = OpLabel
-%2 = OpVariable %27 Function
-%3 = OpVariable %27 Function
-%4 = OpVariable %27 Function
-%5 = OpVariable %27 Function
-%6 = OpVariable %29 Function
-OpStore %2 %7
-OpStore %3 %8
-%10 = OpLoad %25 %2
-%9 = OpCopyObject %25 %10
-OpStore %4 %9
-%12 = OpLoad %25 %3
-%11 = OpCopyObject %25 %12
-OpStore %5 %11
-%14 = OpLoad %25 %4
-%19 = OpConvertUToPtr %30 %14
-%13 = OpLoad %28 %19
-OpStore %6 %13
-%16 = OpLoad %28 %6
-%15 = OpExtInst %28 %23 native_sqrt %16
-OpStore %6 %15
-%17 = OpLoad %25 %5
-%18 = OpLoad %28 %6
-%20 = OpConvertUToPtr %30 %17
-OpStore %20 %18
-OpReturn
-OpFunctionEnd \ No newline at end of file
+ OpCapability GenericPointer
+ OpCapability Linkage
+ OpCapability Addresses
+ OpCapability Kernel
+ OpCapability Int8
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %21 = OpExtInstImport "OpenCL.std"
+ OpMemoryModel Physical64 OpenCL
+ OpEntryPoint Kernel %1 "sqrt"
+ %void = OpTypeVoid
+ %ulong = OpTypeInt 64 0
+ %24 = OpTypeFunction %void %ulong %ulong
+%_ptr_Function_ulong = OpTypePointer Function %ulong
+ %float = OpTypeFloat 32
+%_ptr_Function_float = OpTypePointer Function %float
+%_ptr_Generic_float = OpTypePointer Generic %float
+ %1 = OpFunction %void None %24
+ %7 = OpFunctionParameter %ulong
+ %8 = OpFunctionParameter %ulong
+ %19 = OpLabel
+ %2 = OpVariable %_ptr_Function_ulong Function
+ %3 = OpVariable %_ptr_Function_ulong Function
+ %4 = OpVariable %_ptr_Function_ulong Function
+ %5 = OpVariable %_ptr_Function_ulong Function
+ %6 = OpVariable %_ptr_Function_float Function
+ OpStore %2 %7
+ OpStore %3 %8
+ %9 = OpLoad %ulong %2
+ OpStore %4 %9
+ %10 = OpLoad %ulong %3
+ OpStore %5 %10
+ %12 = OpLoad %ulong %4
+ %17 = OpConvertUToPtr %_ptr_Generic_float %12
+ %11 = OpLoad %float %17
+ OpStore %6 %11
+ %14 = OpLoad %float %6
+ %13 = OpExtInst %float %21 native_sqrt %14
+ OpStore %6 %13
+ %15 = OpLoad %ulong %5
+ %16 = OpLoad %float %6
+ %18 = OpConvertUToPtr %_ptr_Generic_float %15
+ OpStore %18 %16
+ OpReturn
+ OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/sub.spvtxt b/ptx/src/test/spirv_run/sub.spvtxt
index 8520168..88017ae 100644
--- a/ptx/src/test/spirv_run/sub.spvtxt
+++ b/ptx/src/test/spirv_run/sub.spvtxt
@@ -7,19 +7,19 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %25 = OpExtInstImport "OpenCL.std"
+ %23 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "sub"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %28 = OpTypeFunction %void %ulong %ulong
+ %26 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_ulong = OpTypePointer Generic %ulong
%ulong_1 = OpConstant %ulong 1
- %1 = OpFunction %void None %28
+ %1 = OpFunction %void None %26
%8 = OpFunctionParameter %ulong
%9 = OpFunctionParameter %ulong
- %23 = OpLabel
+ %21 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -28,22 +28,20 @@
%7 = OpVariable %_ptr_Function_ulong Function
OpStore %2 %8
OpStore %3 %9
- %11 = OpLoad %ulong %2
- %10 = OpCopyObject %ulong %11
+ %10 = OpLoad %ulong %2
OpStore %4 %10
- %13 = OpLoad %ulong %3
- %12 = OpCopyObject %ulong %13
- OpStore %5 %12
- %15 = OpLoad %ulong %4
- %21 = OpConvertUToPtr %_ptr_Generic_ulong %15
- %14 = OpLoad %ulong %21
- OpStore %6 %14
- %17 = OpLoad %ulong %6
- %16 = OpISub %ulong %17 %ulong_1
- OpStore %7 %16
- %18 = OpLoad %ulong %5
- %19 = OpLoad %ulong %7
- %22 = OpConvertUToPtr %_ptr_Generic_ulong %18
- OpStore %22 %19
+ %11 = OpLoad %ulong %3
+ OpStore %5 %11
+ %13 = OpLoad %ulong %4
+ %19 = OpConvertUToPtr %_ptr_Generic_ulong %13
+ %12 = OpLoad %ulong %19
+ OpStore %6 %12
+ %15 = OpLoad %ulong %6
+ %14 = OpISub %ulong %15 %ulong_1
+ OpStore %7 %14
+ %16 = OpLoad %ulong %5
+ %17 = OpLoad %ulong %7
+ %20 = OpConvertUToPtr %_ptr_Generic_ulong %16
+ OpStore %20 %17
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/vector.spvtxt b/ptx/src/test/spirv_run/vector.spvtxt
index ff0ee97..535e480 100644
--- a/ptx/src/test/spirv_run/vector.spvtxt
+++ b/ptx/src/test/spirv_run/vector.spvtxt
@@ -2,26 +2,29 @@
OpCapability Linkage
OpCapability Addresses
OpCapability Kernel
- OpCapability Int64
OpCapability Int8
- %60 = OpExtInstImport "OpenCL.std"
+ OpCapability Int16
+ OpCapability Int64
+ OpCapability Float16
+ OpCapability Float64
+ %57 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %31 "vector"
%void = OpTypeVoid
%uint = OpTypeInt 32 0
%v2uint = OpTypeVector %uint 2
- %64 = OpTypeFunction %v2uint %v2uint
+ %61 = OpTypeFunction %v2uint %v2uint
%_ptr_Function_v2uint = OpTypePointer Function %v2uint
%_ptr_Function_uint = OpTypePointer Function %uint
%ulong = OpTypeInt 64 0
- %68 = OpTypeFunction %void %ulong %ulong
+ %65 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%_ptr_Generic_v2uint = OpTypePointer Generic %v2uint
- %1 = OpFunction %v2uint None %64
+ %1 = OpFunction %v2uint None %61
%7 = OpFunctionParameter %v2uint
%30 = OpLabel
- %3 = OpVariable %_ptr_Function_v2uint Function
%2 = OpVariable %_ptr_Function_v2uint Function
+ %3 = OpVariable %_ptr_Function_v2uint Function
%4 = OpVariable %_ptr_Function_v2uint Function
%5 = OpVariable %_ptr_Function_uint Function
%6 = OpVariable %_ptr_Function_uint Function
@@ -57,10 +60,10 @@
%26 = OpLoad %v2uint %2
OpReturnValue %26
OpFunctionEnd
- %31 = OpFunction %void None %68
+ %31 = OpFunction %void None %65
%40 = OpFunctionParameter %ulong
%41 = OpFunctionParameter %ulong
- %58 = OpLabel
+ %55 = OpLabel
%32 = OpVariable %_ptr_Function_ulong Function
%33 = OpVariable %_ptr_Function_ulong Function
%34 = OpVariable %_ptr_Function_ulong Function
@@ -71,27 +74,24 @@
%39 = OpVariable %_ptr_Function_ulong Function
OpStore %32 %40
OpStore %33 %41
- %43 = OpLoad %ulong %32
- %42 = OpCopyObject %ulong %43
+ %42 = OpLoad %ulong %32
OpStore %34 %42
- %45 = OpLoad %ulong %33
- %44 = OpCopyObject %ulong %45
- OpStore %35 %44
- %47 = OpLoad %ulong %34
- %54 = OpConvertUToPtr %_ptr_Generic_v2uint %47
- %46 = OpLoad %v2uint %54
+ %43 = OpLoad %ulong %33
+ OpStore %35 %43
+ %45 = OpLoad %ulong %34
+ %52 = OpConvertUToPtr %_ptr_Generic_v2uint %45
+ %44 = OpLoad %v2uint %52
+ OpStore %36 %44
+ %47 = OpLoad %v2uint %36
+ %46 = OpFunctionCall %v2uint %1 %47
OpStore %36 %46
%49 = OpLoad %v2uint %36
- %48 = OpFunctionCall %v2uint %1 %49
- OpStore %36 %48
+ %53 = OpBitcast %ulong %49
+ %48 = OpCopyObject %ulong %53
+ OpStore %39 %48
+ %50 = OpLoad %ulong %35
%51 = OpLoad %v2uint %36
- %55 = OpBitcast %ulong %51
- %56 = OpCopyObject %ulong %55
- %50 = OpCopyObject %ulong %56
- OpStore %39 %50
- %52 = OpLoad %ulong %35
- %53 = OpLoad %v2uint %36
- %57 = OpConvertUToPtr %_ptr_Generic_v2uint %52
- OpStore %57 %53
+ %54 = OpConvertUToPtr %_ptr_Generic_v2uint %50
+ OpStore %54 %51
OpReturn
OpFunctionEnd
diff --git a/ptx/src/test/spirv_run/vector_extract.spvtxt b/ptx/src/test/spirv_run/vector_extract.spvtxt
index 45df3a8..4943189 100644
--- a/ptx/src/test/spirv_run/vector_extract.spvtxt
+++ b/ptx/src/test/spirv_run/vector_extract.spvtxt
@@ -7,12 +7,12 @@
OpCapability Int64
OpCapability Float16
OpCapability Float64
- %75 = OpExtInstImport "OpenCL.std"
+ %73 = OpExtInstImport "OpenCL.std"
OpMemoryModel Physical64 OpenCL
OpEntryPoint Kernel %1 "vector_extract"
%void = OpTypeVoid
%ulong = OpTypeInt 64 0
- %78 = OpTypeFunction %void %ulong %ulong
+ %76 = OpTypeFunction %void %ulong %ulong
%_ptr_Function_ulong = OpTypePointer Function %ulong
%ushort = OpTypeInt 16 0
%_ptr_Function_ushort = OpTypePointer Function %ushort
@@ -21,10 +21,10 @@
%uchar = OpTypeInt 8 0
%v4uchar = OpTypeVector %uchar 4
%_ptr_CrossWorkgroup_v4uchar = OpTypePointer CrossWorkgroup %v4uchar
- %1 = OpFunction %void None %78
+ %1 = OpFunction %void None %76
%11 = OpFunctionParameter %ulong
%12 = OpFunctionParameter %ulong
- %73 = OpLabel
+ %71 = OpLabel
%2 = OpVariable %_ptr_Function_ulong Function
%3 = OpVariable %_ptr_Function_ulong Function
%4 = OpVariable %_ptr_Function_ulong Function
@@ -36,89 +36,87 @@
%10 = OpVariable %_ptr_Function_v4ushort Function
OpStore %2 %11
OpStore %3 %12
- %14 = OpLoad %ulong %2
- %13 = OpCopyObject %ulong %14
+ %13 = OpLoad %ulong %2
OpStore %4 %13
- %16 = OpLoad %ulong %3
- %15 = OpCopyObject %ulong %16
- OpStore %5 %15
- %21 = OpLoad %ulong %4
- %63 = OpConvertUToPtr %_ptr_CrossWorkgroup_v4uchar %21
- %45 = OpLoad %v4uchar %63
- %64 = OpCompositeExtract %uchar %45 0
+ %14 = OpLoad %ulong %3
+ OpStore %5 %14
+ %19 = OpLoad %ulong %4
+ %61 = OpConvertUToPtr %_ptr_CrossWorkgroup_v4uchar %19
+ %43 = OpLoad %v4uchar %61
+ %62 = OpCompositeExtract %uchar %43 0
+ %85 = OpBitcast %uchar %62
+ %15 = OpUConvert %ushort %85
+ %63 = OpCompositeExtract %uchar %43 1
+ %86 = OpBitcast %uchar %63
+ %16 = OpUConvert %ushort %86
+ %64 = OpCompositeExtract %uchar %43 2
%87 = OpBitcast %uchar %64
%17 = OpUConvert %ushort %87
- %65 = OpCompositeExtract %uchar %45 1
+ %65 = OpCompositeExtract %uchar %43 3
%88 = OpBitcast %uchar %65
%18 = OpUConvert %ushort %88
- %66 = OpCompositeExtract %uchar %45 2
- %89 = OpBitcast %uchar %66
- %19 = OpUConvert %ushort %89
- %67 = OpCompositeExtract %uchar %45 3
- %90 = OpBitcast %uchar %67
- %20 = OpUConvert %ushort %90
- OpStore %6 %17
- OpStore %7 %18
- OpStore %8 %19
- OpStore %9 %20
- %23 = OpLoad %ushort %7
- %24 = OpLoad %ushort %8
- %25 = OpLoad %ushort %9
- %26 = OpLoad %ushort %6
- %46 = OpUndef %v4ushort
- %47 = OpCompositeInsert %v4ushort %23 %46 0
- %48 = OpCompositeInsert %v4ushort %24 %47 1
- %49 = OpCompositeInsert %v4ushort %25 %48 2
- %50 = OpCompositeInsert %v4ushort %26 %49 3
- %22 = OpCopyObject %v4ushort %50
- OpStore %10 %22
- %31 = OpLoad %v4ushort %10
- %51 = OpCopyObject %v4ushort %31
- %27 = OpCompositeExtract %ushort %51 0
- %28 = OpCompositeExtract %ushort %51 1
- %29 = OpCompositeExtract %ushort %51 2
- %30 = OpCompositeExtract %ushort %51 3
- OpStore %8 %27
- OpStore %9 %28
- OpStore %6 %29
- OpStore %7 %30
- %36 = OpLoad %ushort %8
- %37 = OpLoad %ushort %9
- %38 = OpLoad %ushort %6
- %39 = OpLoad %ushort %7
- %53 = OpUndef %v4ushort
- %54 = OpCompositeInsert %v4ushort %36 %53 0
- %55 = OpCompositeInsert %v4ushort %37 %54 1
- %56 = OpCompositeInsert %v4ushort %38 %55 2
- %57 = OpCompositeInsert %v4ushort %39 %56 3
- %52 = OpCopyObject %v4ushort %57
- %32 = OpCompositeExtract %ushort %52 0
- %33 = OpCompositeExtract %ushort %52 1
- %34 = OpCompositeExtract %ushort %52 2
- %35 = OpCompositeExtract %ushort %52 3
- OpStore %9 %32
- OpStore %6 %33
- OpStore %7 %34
- OpStore %8 %35
- %40 = OpLoad %ulong %5
- %41 = OpLoad %ushort %6
- %42 = OpLoad %ushort %7
- %43 = OpLoad %ushort %8
- %44 = OpLoad %ushort %9
- %58 = OpUndef %v4uchar
+ OpStore %6 %15
+ OpStore %7 %16
+ OpStore %8 %17
+ OpStore %9 %18
+ %21 = OpLoad %ushort %7
+ %22 = OpLoad %ushort %8
+ %23 = OpLoad %ushort %9
+ %24 = OpLoad %ushort %6
+ %44 = OpUndef %v4ushort
+ %45 = OpCompositeInsert %v4ushort %21 %44 0
+ %46 = OpCompositeInsert %v4ushort %22 %45 1
+ %47 = OpCompositeInsert %v4ushort %23 %46 2
+ %48 = OpCompositeInsert %v4ushort %24 %47 3
+ %20 = OpCopyObject %v4ushort %48
+ OpStore %10 %20
+ %29 = OpLoad %v4ushort %10
+ %49 = OpCopyObject %v4ushort %29
+ %25 = OpCompositeExtract %ushort %49 0
+ %26 = OpCompositeExtract %ushort %49 1
+ %27 = OpCompositeExtract %ushort %49 2
+ %28 = OpCompositeExtract %ushort %49 3
+ OpStore %8 %25
+ OpStore %9 %26
+ OpStore %6 %27
+ OpStore %7 %28
+ %34 = OpLoad %ushort %8
+ %35 = OpLoad %ushort %9
+ %36 = OpLoad %ushort %6
+ %37 = OpLoad %ushort %7
+ %51 = OpUndef %v4ushort
+ %52 = OpCompositeInsert %v4ushort %34 %51 0
+ %53 = OpCompositeInsert %v4ushort %35 %52 1
+ %54 = OpCompositeInsert %v4ushort %36 %53 2
+ %55 = OpCompositeInsert %v4ushort %37 %54 3
+ %50 = OpCopyObject %v4ushort %55
+ %30 = OpCompositeExtract %ushort %50 0
+ %31 = OpCompositeExtract %ushort %50 1
+ %32 = OpCompositeExtract %ushort %50 2
+ %33 = OpCompositeExtract %ushort %50 3
+ OpStore %9 %30
+ OpStore %6 %31
+ OpStore %7 %32
+ OpStore %8 %33
+ %38 = OpLoad %ulong %5
+ %39 = OpLoad %ushort %6
+ %40 = OpLoad %ushort %7
+ %41 = OpLoad %ushort %8
+ %42 = OpLoad %ushort %9
+ %56 = OpUndef %v4uchar
+ %89 = OpBitcast %ushort %39
+ %66 = OpUConvert %uchar %89
+ %57 = OpCompositeInsert %v4uchar %66 %56 0
+ %90 = OpBitcast %ushort %40
+ %67 = OpUConvert %uchar %90
+ %58 = OpCompositeInsert %v4uchar %67 %57 1
%91 = OpBitcast %ushort %41
%68 = OpUConvert %uchar %91
- %59 = OpCompositeInsert %v4uchar %68 %58 0
+ %59 = OpCompositeInsert %v4uchar %68 %58 2
%92 = OpBitcast %ushort %42
%69 = OpUConvert %uchar %92
- %60 = OpCompositeInsert %v4uchar %69 %59 1
- %93 = OpBitcast %ushort %43
- %70 = OpUConvert %uchar %93
- %61 = OpCompositeInsert %v4uchar %70 %60 2
- %94 = OpBitcast %ushort %44
- %71 = OpUConvert %uchar %94
- %62 = OpCompositeInsert %v4uchar %71 %61 3
- %72 = OpConvertUToPtr %_ptr_CrossWorkgroup_v4uchar %40
- OpStore %72 %62
+ %60 = OpCompositeInsert %v4uchar %69 %59 3
+ %70 = OpConvertUToPtr %_ptr_CrossWorkgroup_v4uchar %38
+ OpStore %70 %60
OpReturn
OpFunctionEnd
diff --git a/ptx/src/translate.rs b/ptx/src/translate.rs
index 36e15f9..7a0dd08 100644
--- a/ptx/src/translate.rs
+++ b/ptx/src/translate.rs
@@ -1,7 +1,7 @@
use crate::ast;
use half::f16;
use rspirv::{binary::Disassemble, dr};
-use std::{borrow::Cow, hash::Hash, iter, mem};
+use std::{borrow::Cow, convert::TryFrom, hash::Hash, iter, mem};
use std::{
collections::{hash_map, HashMap, HashSet},
convert::TryInto,
@@ -50,20 +50,45 @@ impl From<ast::Type> for SpirvType {
ast::Type::Scalar(t) => SpirvType::Base(t.into()),
ast::Type::Vector(typ, len) => SpirvType::Vector(typ.into(), len),
ast::Type::Array(t, len) => SpirvType::Array(t.into(), len),
- ast::Type::Pointer(ast::PointerType::Scalar(typ), state_space) => SpirvType::Pointer(
- Box::new(SpirvType::Base(typ.into())),
+ ast::Type::Pointer(pointer_t, state_space) => SpirvType::Pointer(
+ Box::new(SpirvType::from(ast::Type::from(pointer_t))),
state_space.to_spirv(),
),
- ast::Type::Pointer(ast::PointerType::Vector(typ, len), state_space) => {
- SpirvType::Pointer(
- Box::new(SpirvType::Vector(typ.into(), len)),
- state_space.to_spirv(),
- )
+ }
+ }
+}
+
+impl From<ast::PointerType> for ast::Type {
+ fn from(t: ast::PointerType) -> Self {
+ match t {
+ ast::PointerType::Scalar(t) => ast::Type::Scalar(t),
+ ast::PointerType::Vector(t, len) => ast::Type::Vector(t, len),
+ ast::PointerType::Array(t, dims) => ast::Type::Array(t, dims),
+ ast::PointerType::Pointer(t, space) => {
+ ast::Type::Pointer(ast::PointerType::Scalar(t), space)
}
}
}
}
+impl ast::Type {
+ fn pointer_to(self, space: ast::LdStateSpace) -> Result<Self, TranslateError> {
+ Ok(match self {
+ ast::Type::Scalar(t) => ast::Type::Pointer(ast::PointerType::Scalar(t), space),
+ ast::Type::Vector(t, len) => {
+ ast::Type::Pointer(ast::PointerType::Vector(t, len), space)
+ }
+ ast::Type::Array(t, dims) => {
+ ast::Type::Pointer(ast::PointerType::Array(t, dims), space)
+ }
+ ast::Type::Pointer(ast::PointerType::Scalar(t), space) => {
+ ast::Type::Pointer(ast::PointerType::Pointer(t, space), space)
+ }
+ ast::Type::Pointer(_, _) => return Err(TranslateError::Unreachable),
+ })
+ }
+}
+
impl Into<spirv::StorageClass> for ast::PointerStateSpace {
fn into(self) -> spirv::StorageClass {
match self {
@@ -229,8 +254,8 @@ impl TypeWordMap {
fn get_or_add_fn(
&mut self,
b: &mut dr::Builder,
- mut out_params: impl ExactSizeIterator<Item = SpirvType>,
in_params: impl ExactSizeIterator<Item = SpirvType>,
+ mut out_params: impl ExactSizeIterator<Item = SpirvType>,
) -> (spirv::Word, spirv::Word) {
let (out_args, out_spirv_type) = if out_params.len() == 0 {
(None, self.void())
@@ -486,7 +511,7 @@ fn emit_directives<'input>(
map: &mut TypeWordMap,
id_defs: &GlobalStringIdResolver<'input>,
opencl_id: spirv::Word,
- denorm_information: &HashMap<CallgraphKey<'input>, HashMap<u8, spirv::FPDenormMode>>,
+ denorm_information: &HashMap<MethodName<'input>, HashMap<u8, spirv::FPDenormMode>>,
call_map: &HashMap<&'input str, HashSet<spirv::Word>>,
directives: Vec<Directive>,
kernel_info: &mut HashMap<String, KernelInfo>,
@@ -516,7 +541,7 @@ fn emit_directives<'input>(
map,
&id_defs,
&f.globals,
- &f.func_decl,
+ &f.spirv_decl,
&denorm_information,
call_map,
&directives,
@@ -553,7 +578,7 @@ fn get_call_map<'input>(
body: Some(statements),
..
}) => {
- let call_key = CallgraphKey::new(&func_decl);
+ let call_key = MethodName::new(&func_decl);
for statement in statements {
match statement {
Statement::Call(call) => {
@@ -569,28 +594,28 @@ fn get_call_map<'input>(
let mut result = HashMap::new();
for (method_key, children) in directly_called_by.iter() {
match method_key {
- CallgraphKey::Kernel(name) => {
+ MethodName::Kernel(name) => {
let mut visited = HashSet::new();
for child in children {
add_call_map_single(&directly_called_by, &mut visited, *child);
}
result.insert(*name, visited);
}
- CallgraphKey::Func(_) => {}
+ MethodName::Func(_) => {}
}
}
result
}
fn add_call_map_single<'input>(
- directly_called_by: &MultiHashMap<CallgraphKey<'input>, spirv::Word>,
+ directly_called_by: &MultiHashMap<MethodName<'input>, spirv::Word>,
visited: &mut HashSet<spirv::Word>,
current: spirv::Word,
) {
if !visited.insert(current) {
return;
}
- if let Some(children) = directly_called_by.get(&CallgraphKey::Func(current)) {
+ if let Some(children) = directly_called_by.get(&MethodName::Func(current)) {
for child in children {
add_call_map_single(directly_called_by, visited, *child);
}
@@ -645,8 +670,9 @@ fn convert_dynamic_shared_memory_usage<'input>(
globals,
body: Some(statements),
import_as,
+ spirv_decl,
}) => {
- let call_key = CallgraphKey::new(&func_decl);
+ let call_key = MethodName::new(&func_decl);
let statements = statements
.into_iter()
.map(|statement| match statement {
@@ -667,6 +693,7 @@ fn convert_dynamic_shared_memory_usage<'input>(
globals,
body: Some(statements),
import_as,
+ spirv_decl,
})
}
directive => directive,
@@ -680,44 +707,34 @@ fn convert_dynamic_shared_memory_usage<'input>(
.into_iter()
.map(|directive| match directive {
Directive::Method(Function {
- mut func_decl,
+ func_decl,
globals,
body: Some(statements),
import_as,
+ mut spirv_decl,
}) => {
- let call_key = CallgraphKey::new(&func_decl);
- if !methods_using_extern_shared.contains(&call_key) {
+ if !methods_using_extern_shared.contains(&spirv_decl.name) {
return Directive::Method(Function {
func_decl,
globals,
body: Some(statements),
import_as,
+ spirv_decl,
});
}
let shared_id_param = new_id();
- match &mut func_decl {
- ast::MethodDecl::Func(_, _, input_args) => {
- input_args.push(ast::Variable {
- align: None,
- v_type: ast::FnArgumentType::Shared,
- array_init: Vec::new(),
- name: shared_id_param,
- });
- }
- ast::MethodDecl::Kernel {
- in_args,
- uses_shared_mem,
- ..
- } => {
- *uses_shared_mem = true;
- in_args.push(ast::Variable {
- align: None,
- v_type: ast::KernelArgumentType::Shared,
- array_init: Vec::new(),
- name: shared_id_param,
- });
+ spirv_decl.input.push({
+ ast::Variable {
+ align: None,
+ v_type: ast::Type::Pointer(
+ ast::PointerType::Scalar(ast::ScalarType::U8),
+ ast::LdStateSpace::Shared,
+ ),
+ array_init: Vec::new(),
+ name: shared_id_param,
}
- }
+ });
+ spirv_decl.uses_shared_mem = true;
let shared_var_id = new_id();
let shared_var = ExpandedStatement::Variable(ast::Variable {
align: None,
@@ -750,6 +767,7 @@ fn convert_dynamic_shared_memory_usage<'input>(
globals,
body: Some(new_statements),
import_as,
+ spirv_decl,
})
}
directive => directive,
@@ -761,7 +779,7 @@ fn replace_uses_of_shared_memory<'a>(
result: &mut Vec<ExpandedStatement>,
new_id: &mut impl FnMut() -> spirv::Word,
extern_shared_decls: &HashMap<spirv::Word, ast::SizedScalarType>,
- methods_using_extern_shared: &mut HashSet<CallgraphKey<'a>>,
+ methods_using_extern_shared: &mut HashSet<MethodName<'a>>,
shared_id_param: spirv::Word,
shared_var_id: spirv::Word,
statements: Vec<ExpandedStatement>,
@@ -772,7 +790,7 @@ fn replace_uses_of_shared_memory<'a>(
// We can safely skip checking call arguments,
// because there's simply no way to pass shared ptr
// without converting it to .b64 first
- if methods_using_extern_shared.contains(&CallgraphKey::Func(call.func)) {
+ if methods_using_extern_shared.contains(&MethodName::Func(call.func)) {
call.param_list
.push((shared_id_param, ast::FnArgumentType::Shared));
}
@@ -809,13 +827,13 @@ fn replace_uses_of_shared_memory<'a>(
}
fn get_callers_of_extern_shared<'a>(
- methods_using_extern_shared: &mut HashSet<CallgraphKey<'a>>,
- directly_called_by: &MultiHashMap<spirv::Word, CallgraphKey<'a>>,
+ methods_using_extern_shared: &mut HashSet<MethodName<'a>>,
+ directly_called_by: &MultiHashMap<spirv::Word, MethodName<'a>>,
) {
let direct_uses_of_extern_shared = methods_using_extern_shared
.iter()
.filter_map(|method| {
- if let CallgraphKey::Func(f_id) = method {
+ if let MethodName::Func(f_id) = method {
Some(*f_id)
} else {
None
@@ -828,14 +846,14 @@ fn get_callers_of_extern_shared<'a>(
}
fn get_callers_of_extern_shared_single<'a>(
- methods_using_extern_shared: &mut HashSet<CallgraphKey<'a>>,
- directly_called_by: &MultiHashMap<spirv::Word, CallgraphKey<'a>>,
+ methods_using_extern_shared: &mut HashSet<MethodName<'a>>,
+ directly_called_by: &MultiHashMap<spirv::Word, MethodName<'a>>,
fn_id: spirv::Word,
) {
if let Some(callers) = directly_called_by.get(&fn_id) {
for caller in callers {
if methods_using_extern_shared.insert(*caller) {
- if let CallgraphKey::Func(caller_fn) = caller {
+ if let MethodName::Func(caller_fn) = caller {
get_callers_of_extern_shared_single(
methods_using_extern_shared,
directly_called_by,
@@ -877,7 +895,7 @@ fn denorm_count_map_update_impl<T: Eq + Hash>(
// and emit suitable execution mode
fn compute_denorm_information<'input>(
module: &[Directive<'input>],
-) -> HashMap<CallgraphKey<'input>, HashMap<u8, spirv::FPDenormMode>> {
+) -> HashMap<MethodName<'input>, HashMap<u8, spirv::FPDenormMode>> {
let mut denorm_methods = HashMap::new();
for directive in module {
match directive {
@@ -888,7 +906,7 @@ fn compute_denorm_information<'input>(
..
}) => {
let mut flush_counter = DenormCountMap::new();
- let method_key = CallgraphKey::new(func_decl);
+ let method_key = MethodName::new(func_decl);
for statement in statements {
match statement {
Statement::Instruction(inst) => {
@@ -907,6 +925,7 @@ fn compute_denorm_information<'input>(
Statement::Undef(_, _) => {}
Statement::Label(_) => {}
Statement::Variable(_) => {}
+ Statement::PtrAdd { .. } => {}
}
}
denorm_methods.insert(method_key, flush_counter);
@@ -933,16 +952,16 @@ fn compute_denorm_information<'input>(
}
#[derive(Hash, PartialEq, Eq, Copy, Clone)]
-enum CallgraphKey<'input> {
+enum MethodName<'input> {
Kernel(&'input str),
Func(spirv::Word),
}
-impl<'input> CallgraphKey<'input> {
+impl<'input> MethodName<'input> {
fn new(decl: &ast::MethodDecl<'input, spirv::Word>) -> Self {
match decl {
- ast::MethodDecl::Kernel { name, .. } => CallgraphKey::Kernel(name),
- ast::MethodDecl::Func(_, id, _) => CallgraphKey::Func(*id),
+ ast::MethodDecl::Kernel { name, .. } => MethodName::Kernel(name),
+ ast::MethodDecl::Func(_, id, _) => MethodName::Func(*id),
}
}
}
@@ -979,30 +998,30 @@ fn emit_function_header<'a>(
map: &mut TypeWordMap,
defined_globals: &GlobalStringIdResolver<'a>,
synthetic_globals: &[ast::Variable<ast::VariableType, spirv::Word>],
- func_directive: &ast::MethodDecl<spirv::Word>,
- denorm_information: &HashMap<CallgraphKey<'a>, HashMap<u8, spirv::FPDenormMode>>,
+ func_decl: &SpirvMethodDecl<'a>,
+ _denorm_information: &HashMap<MethodName<'a>, HashMap<u8, spirv::FPDenormMode>>,
call_map: &HashMap<&'a str, HashSet<spirv::Word>>,
direcitves: &[Directive],
kernel_info: &mut HashMap<String, KernelInfo>,
) -> Result<(), TranslateError> {
- if let ast::MethodDecl::Kernel {
- name,
- in_args,
- uses_shared_mem,
- } = &func_directive
- {
- let args_lens = in_args.iter().map(|param| param.v_type.width()).collect();
+ if let MethodName::Kernel(name) = func_decl.name {
+ let args_lens = func_decl
+ .input
+ .iter()
+ .map(|param| param.v_type.size_of())
+ .collect();
kernel_info.insert(
name.to_string(),
KernelInfo {
arguments_sizes: args_lens,
- uses_shared_mem: *uses_shared_mem,
+ uses_shared_mem: func_decl.uses_shared_mem,
},
);
}
- let (ret_type, func_type) = get_function_type(builder, map, &func_directive);
- let fn_id = match func_directive {
- ast::MethodDecl::Kernel { name, .. } => {
+ let (ret_type, func_type) =
+ get_function_type(builder, map, &func_decl.input, &func_decl.output);
+ let fn_id = match func_decl.name {
+ MethodName::Kernel(name) => {
let fn_id = defined_globals.get_id(name)?;
let mut global_variables = defined_globals
.variables_type_check
@@ -1035,17 +1054,11 @@ fn emit_function_header<'a>(
_ => {}
}
}
-
global_variables.append(&mut interface);
- builder.entry_point(
- spirv::ExecutionModel::Kernel,
- fn_id,
- *name,
- global_variables,
- );
+ builder.entry_point(spirv::ExecutionModel::Kernel, fn_id, name, global_variables);
fn_id
}
- ast::MethodDecl::Func(_, name, _) => *name,
+ MethodName::Func(name) => name,
};
builder.begin_function(
ret_type,
@@ -1053,7 +1066,9 @@ fn emit_function_header<'a>(
spirv::FunctionControl::NONE,
func_type,
)?;
- if let Some(denorm_modes) = denorm_information.get(&CallgraphKey::new(&func_directive)) {
+ // TODO: re-enable when Intel float control extension works
+ /*
+ if let Some(denorm_modes) = denorm_information.get(&func_decl.name) {
for (size_of, denorm_mode) in denorm_modes {
builder.decorate(
fn_id,
@@ -1065,16 +1080,17 @@ fn emit_function_header<'a>(
)
}
}
- func_directive.visit_args(&mut |arg| {
- let result_type = map.get_or_add(builder, ast::Type::from(arg.v_type.clone()).into());
+ */
+ for input in &func_decl.input {
+ let result_type = map.get_or_add(builder, SpirvType::from(input.v_type.clone()));
let inst = dr::Instruction::new(
spirv::Op::FunctionParameter,
Some(result_type),
- Some(arg.name),
+ Some(input.name),
Vec::new(),
);
builder.function.as_mut().unwrap().parameters.push(inst);
- });
+ }
Ok(())
}
@@ -1103,12 +1119,14 @@ fn emit_capabilities(builder: &mut dr::Builder) {
builder.capability(spirv::Capability::Int64);
builder.capability(spirv::Capability::Float16);
builder.capability(spirv::Capability::Float64);
- builder.capability(spirv::Capability::FunctionFloatControlINTEL);
+ // TODO: re-enable when Intel float control extension works
+ //builder.capability(spirv::Capability::FunctionFloatControlINTEL);
}
// http://htmlpreview.github.io/?https://github.com/KhronosGroup/SPIRV-Registry/blob/master/extensions/KHR/SPV_KHR_float_controls.html
-fn emit_extensions(builder: &mut dr::Builder) {
- builder.extension("SPV_INTEL_float_controls2");
+fn emit_extensions(_builder: &mut dr::Builder) {
+ // TODO: re-enable when Intel float control extension works
+ //builder.extension("SPV_INTEL_float_controls2");
}
fn emit_opencl_import(builder: &mut dr::Builder) -> spirv::Word {
@@ -1153,42 +1171,48 @@ fn translate_function<'a>(
ptx_impl_imports: &mut HashMap<String, Directive>,
f: ast::ParsedFunction<'a>,
) -> Result<Function<'a>, TranslateError> {
- let (str_resolver, fn_resolver, fn_decl) = id_defs.start_fn(&f.func_directive);
+ let (str_resolver, fn_resolver, fn_decl) = id_defs.start_fn(&f.func_directive)?;
to_ssa(ptx_impl_imports, str_resolver, fn_resolver, fn_decl, f.body)
}
fn expand_kernel_params<'a, 'b>(
fn_resolver: &mut FnStringIdResolver<'a, 'b>,
args: impl Iterator<Item = &'b ast::KernelArgument<&'a str>>,
-) -> Vec<ast::KernelArgument<spirv::Word>> {
- args.map(|a| ast::KernelArgument {
- name: fn_resolver.add_def(
- a.name,
- Some((StateSpace::Param, ast::Type::from(a.v_type.clone()))),
- ),
- v_type: a.v_type.clone(),
- align: a.align,
- array_init: Vec::new(),
+) -> Result<Vec<ast::KernelArgument<spirv::Word>>, TranslateError> {
+ args.map(|a| {
+ Ok(ast::KernelArgument {
+ name: fn_resolver.add_def(
+ a.name,
+ Some((
+ StateSpace::Param,
+ ast::Type::from(a.v_type.clone()).pointer_to(ast::LdStateSpace::Param)?,
+ )),
+ ),
+ v_type: a.v_type.clone(),
+ align: a.align,
+ array_init: Vec::new(),
+ })
})
- .collect()
+ .collect::<Result<_, _>>()
}
fn expand_fn_params<'a, 'b>(
fn_resolver: &mut FnStringIdResolver<'a, 'b>,
args: impl Iterator<Item = &'b ast::FnArgument<&'a str>>,
-) -> Vec<ast::FnArgument<spirv::Word>> {
+) -> Result<Vec<ast::FnArgument<spirv::Word>>, TranslateError> {
args.map(|a| {
+ let var_type = a.v_type.to_func_type();
let ss = match a.v_type {
ast::FnArgumentType::Reg(_) => StateSpace::Reg,
ast::FnArgumentType::Param(_) => StateSpace::Param,
ast::FnArgumentType::Shared => StateSpace::Shared,
};
- ast::FnArgument {
- name: fn_resolver.add_def(a.name, Some((ss, ast::Type::from(a.v_type.clone())))),
+ Ok(ast::FnArgument {
+ name: fn_resolver.add_def(a.name, Some((ss, var_type))),
v_type: a.v_type.clone(),
align: a.align,
array_init: Vec::new(),
- }
+ })
})
.collect()
}
@@ -1200,6 +1224,7 @@ fn to_ssa<'input, 'b>(
f_args: ast::MethodDecl<'input, spirv::Word>,
f_body: Option<Vec<ast::Statement<ast::ParsedArgParams<'input>>>>,
) -> Result<Function<'input>, TranslateError> {
+ let mut spirv_decl = SpirvMethodDecl::new(&f_args);
let f_body = match f_body {
Some(vec) => vec,
None => {
@@ -1208,6 +1233,7 @@ fn to_ssa<'input, 'b>(
body: None,
globals: Vec::new(),
import_as: None,
+ spirv_decl,
})
}
};
@@ -1217,8 +1243,8 @@ fn to_ssa<'input, 'b>(
let typed_statements =
convert_to_typed_statements(unadorned_statements, &fn_defs, &numeric_id_defs)?;
let mut numeric_id_defs = numeric_id_defs.finish();
- let (f_args, ssa_statements) =
- insert_mem_ssa_statements(typed_statements, &mut numeric_id_defs, f_args)?;
+ let ssa_statements =
+ insert_mem_ssa_statements(typed_statements, &mut numeric_id_defs, &mut spirv_decl)?;
let expanded_statements = expand_arguments(ssa_statements, &mut numeric_id_defs)?;
let expanded_statements =
insert_implicit_conversions(expanded_statements, &mut numeric_id_defs)?;
@@ -1231,6 +1257,7 @@ fn to_ssa<'input, 'b>(
globals: globals,
body: Some(f_body),
import_as: None,
+ spirv_decl,
})
}
@@ -1338,13 +1365,21 @@ fn convert_to_typed_statements(
ast::Instruction::Call(call) => {
// TODO: error out if lengths don't match
let fn_def = fn_defs.get_fn_decl(call.func)?;
- let ret_params = to_resolved_fn_args(call.ret_params, &*fn_def.ret_vals);
- let param_list = to_resolved_fn_args(call.param_list, &*fn_def.params);
+ let out_args = to_resolved_fn_args(call.ret_params, &*fn_def.ret_vals);
+ let in_args = to_resolved_fn_args(call.param_list, &*fn_def.params);
+ let (out_params, out_non_params): (Vec<_>, Vec<_>) = out_args
+ .into_iter()
+ .partition(|(_, arg_type)| arg_type.is_param());
+ let normalized_input_args = out_params
+ .into_iter()
+ .map(|(id, typ)| (ast::CallOperand::Reg(id), typ))
+ .chain(in_args.into_iter())
+ .collect();
let resolved_call = ResolvedCall {
uniform: call.uniform,
- ret_params,
+ ret_params: out_non_params,
func: call.func,
- param_list,
+ param_list: normalized_input_args,
};
result.push(Statement::Call(resolved_call));
}
@@ -1514,6 +1549,30 @@ fn convert_to_typed_statements(
ast::Instruction::Neg(d, a) => {
result.push(Statement::Instruction(ast::Instruction::Neg(d, a.cast())))
}
+ ast::Instruction::Sin { flush_to_zero, arg } => {
+ result.push(Statement::Instruction(ast::Instruction::Sin {
+ flush_to_zero,
+ arg: arg.cast(),
+ }))
+ }
+ ast::Instruction::Cos { flush_to_zero, arg } => {
+ result.push(Statement::Instruction(ast::Instruction::Cos {
+ flush_to_zero,
+ arg: arg.cast(),
+ }))
+ }
+ ast::Instruction::Lg2 { flush_to_zero, arg } => {
+ result.push(Statement::Instruction(ast::Instruction::Lg2 {
+ flush_to_zero,
+ arg: arg.cast(),
+ }))
+ }
+ ast::Instruction::Ex2 { flush_to_zero, arg } => {
+ result.push(Statement::Instruction(ast::Instruction::Ex2 {
+ flush_to_zero,
+ arg: arg.cast(),
+ }))
+ }
},
Statement::Label(i) => result.push(Statement::Label(i)),
Statement::Variable(v) => result.push(Statement::Variable(v)),
@@ -1525,7 +1584,9 @@ fn convert_to_typed_statements(
Statement::Conversion(c) => result.push(Statement::Conversion(c)),
Statement::Constant(c) => result.push(Statement::Constant(c)),
Statement::RetValue(d, id) => result.push(Statement::RetValue(d, id)),
- Statement::Undef(_, _) => return Err(TranslateError::Unreachable),
+ Statement::Undef(_, _) | Statement::PtrAdd { .. } => {
+ return Err(TranslateError::Unreachable)
+ }
}
}
Ok(result)
@@ -1584,11 +1645,13 @@ fn to_ptx_impl_atomic_call(
},
],
);
+ let spirv_decl = SpirvMethodDecl::new(&func_decl);
let func = Function {
func_decl,
globals: Vec::new(),
body: None,
import_as: Some(entry.key().clone()),
+ spirv_decl,
};
entry.insert(Directive::Method(func));
fn_id
@@ -1660,7 +1723,8 @@ fn normalize_labels(
| Statement::Conversion(_)
| Statement::Constant(_)
| Statement::Label(_)
- | Statement::Undef(_, _) => (),
+ | Statement::Undef(_, _)
+ | Statement::PtrAdd { .. } => {}
}
}
iter::once(Statement::Label(id_def.new_id(None)))
@@ -1716,66 +1780,45 @@ fn normalize_predicates(
fn insert_mem_ssa_statements<'a, 'b>(
func: Vec<TypedStatement>,
id_def: &mut MutableNumericIdResolver,
- mut f_args: ast::MethodDecl<'a, spirv::Word>,
-) -> Result<(ast::MethodDecl<'a, spirv::Word>, Vec<TypedStatement>), TranslateError> {
+ fn_decl: &mut SpirvMethodDecl,
+) -> Result<Vec<TypedStatement>, TranslateError> {
let mut result = Vec::with_capacity(func.len());
- let out_param = match &mut f_args {
- ast::MethodDecl::Kernel { in_args, .. } => {
- for p in in_args.iter_mut() {
- let typ = ast::Type::from(p.v_type.clone());
- let new_id = id_def.new_id(typ.clone());
+ for arg in fn_decl.output.iter() {
+ match type_to_variable_type(&arg.v_type)? {
+ Some(var_type) => {
result.push(Statement::Variable(ast::Variable {
- align: p.align,
- v_type: ast::VariableType::Param(p.v_type.clone().to_param()),
- name: p.name,
- array_init: p.array_init.clone(),
+ align: arg.align,
+ v_type: var_type,
+ name: arg.name,
+ array_init: arg.array_init.clone(),
}));
- result.push(Statement::StoreVar(
- ast::Arg2St {
- src1: p.name,
- src2: new_id,
- },
- typ,
- ));
- p.name = new_id;
}
- None
+ None => return Err(TranslateError::Unreachable),
}
- ast::MethodDecl::Func(out_params, _, in_params) => {
- for p in in_params.iter_mut() {
- let typ = ast::Type::from(p.v_type.clone());
+ }
+ for arg in fn_decl.input.iter_mut() {
+ match type_to_variable_type(&arg.v_type)? {
+ Some(var_type) => {
+ let typ = arg.v_type.clone();
let new_id = id_def.new_id(typ.clone());
- let var_typ = ast::VariableType::from(p.v_type.clone());
result.push(Statement::Variable(ast::Variable {
- align: p.align,
- v_type: var_typ,
- name: p.name,
- array_init: p.array_init.clone(),
+ align: arg.align,
+ v_type: var_type,
+ name: arg.name,
+ array_init: arg.array_init.clone(),
}));
result.push(Statement::StoreVar(
ast::Arg2St {
- src1: p.name,
+ src1: arg.name,
src2: new_id,
},
- typ.clone(),
+ typ,
));
- p.name = new_id;
- }
- match &mut **out_params {
- [p] => {
- result.push(Statement::Variable(ast::Variable {
- align: p.align,
- v_type: ast::VariableType::from(p.v_type.clone()),
- name: p.name,
- array_init: p.array_init.clone(),
- }));
- Some(p.name)
- }
- [] => None,
- _ => todo!(),
+ arg.name = new_id;
}
+ None => {}
}
- };
+ }
for s in func {
match s {
Statement::Call(call) => {
@@ -1783,13 +1826,14 @@ fn insert_mem_ssa_statements<'a, 'b>(
}
Statement::Instruction(inst) => match inst {
ast::Instruction::Ret(d) => {
- if let Some(out_param) = out_param {
- let typ = id_def.get_typed(out_param)?;
+ // TODO: handle multiple output args
+ if let &[out_param] = &fn_decl.output.as_slice() {
+ let typ = id_def.get_typed(out_param.name)?;
let new_id = id_def.new_id(typ.clone());
result.push(Statement::LoadVar(
ast::Arg2 {
dst: new_id,
- src: out_param,
+ src: out_param.name,
},
typ.clone(),
));
@@ -1818,11 +1862,31 @@ fn insert_mem_ssa_statements<'a, 'b>(
| Statement::Conversion(_)
| Statement::RetValue(_, _)
| Statement::Constant(_)
- | Statement::Undef(_, _) => {}
+ | Statement::Undef(_, _)
+ | Statement::PtrAdd { .. } => {}
Statement::Composite(_) => todo!(),
}
}
- Ok((f_args, result))
+ Ok(result)
+}
+
+fn type_to_variable_type(t: &ast::Type) -> Result<Option<ast::VariableType>, TranslateError> {
+ Ok(match t {
+ ast::Type::Scalar(typ) => Some(ast::VariableType::Reg(ast::VariableRegType::Scalar(*typ))),
+ ast::Type::Vector(typ, len) => Some(ast::VariableType::Reg(ast::VariableRegType::Vector(
+ (*typ)
+ .try_into()
+ .map_err(|_| TranslateError::MismatchedType)?,
+ *len,
+ ))),
+ ast::Type::Array(typ, len) => Some(ast::VariableType::Reg(ast::VariableRegType::Array(
+ (*typ)
+ .try_into()
+ .map_err(|_| TranslateError::MismatchedType)?,
+ len.clone(),
+ ))),
+ ast::Type::Pointer(_, _) => None,
+ })
}
trait VisitVariable: Sized {
@@ -1849,6 +1913,28 @@ trait VisitVariableExpanded {
) -> Result<ExpandedStatement, TranslateError>;
}
+struct VisitArgumentDescriptor<'a, Ctor: FnOnce(spirv::Word) -> ExpandedStatement> {
+ desc: ArgumentDescriptor<spirv::Word>,
+ typ: &'a ast::Type,
+ stmt_ctor: Ctor,
+}
+
+impl<'a, Ctor: FnOnce(spirv::Word) -> ExpandedStatement> VisitVariableExpanded
+ for VisitArgumentDescriptor<'a, Ctor>
+{
+ fn visit_variable_extended<
+ F: FnMut(
+ ArgumentDescriptor<spirv::Word>,
+ Option<&ast::Type>,
+ ) -> Result<spirv::Word, TranslateError>,
+ >(
+ self,
+ f: &mut F,
+ ) -> Result<ExpandedStatement, TranslateError> {
+ f(self.desc, Some(self.typ)).map(self.stmt_ctor)
+ }
+}
+
fn insert_mem_ssa_statement_default<'a, F: VisitVariable>(
id_def: &mut MutableNumericIdResolver,
result: &mut Vec<TypedStatement>,
@@ -1857,7 +1943,7 @@ fn insert_mem_ssa_statement_default<'a, F: VisitVariable>(
let mut post_statements = Vec::new();
let new_statement =
stmt.visit_variable(&mut |desc: ArgumentDescriptor<spirv::Word>, instr_type| {
- if instr_type.is_none() {
+ if instr_type.is_none() || desc.sema == ArgumentSemantics::RegisterPointer {
return Ok(desc.op);
}
let id_type = match (id_def.get_typed(desc.op)?, desc.sema) {
@@ -1925,6 +2011,56 @@ fn expand_arguments<'a, 'b>(
name,
array_init,
})),
+ Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst,
+ ptr_src,
+ constant_src,
+ } => {
+ let mut visitor = FlattenArguments::new(&mut result, id_def);
+ let sema = match state_space {
+ ast::LdStateSpace::Const
+ | ast::LdStateSpace::Global
+ | ast::LdStateSpace::Shared
+ | ast::LdStateSpace::Generic => ArgumentSemantics::PhysicalPointer,
+ ast::LdStateSpace::Local | ast::LdStateSpace::Param => {
+ ArgumentSemantics::RegisterPointer
+ }
+ };
+ let ptr_type = ast::Type::Pointer(underlying_type.clone(), state_space);
+ let new_dst = visitor.id(
+ ArgumentDescriptor {
+ op: dst,
+ is_dst: true,
+ sema,
+ },
+ Some(&ptr_type),
+ )?;
+ let new_ptr_src = visitor.id(
+ ArgumentDescriptor {
+ op: ptr_src,
+ is_dst: false,
+ sema,
+ },
+ Some(&ptr_type),
+ )?;
+ let new_constant_src = visitor.id(
+ ArgumentDescriptor {
+ op: constant_src,
+ is_dst: false,
+ sema: ArgumentSemantics::Default,
+ },
+ Some(&ast::Type::Scalar(ast::ScalarType::S64)),
+ )?;
+ result.push(Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst: new_dst,
+ ptr_src: new_ptr_src,
+ constant_src: new_constant_src,
+ })
+ }
Statement::Label(id) => result.push(Statement::Label(id)),
Statement::Conditional(bra) => result.push(Statement::Conditional(bra)),
Statement::LoadVar(arg, typ) => result.push(Statement::LoadVar(arg, typ)),
@@ -1990,83 +2126,94 @@ impl<'a, 'b> FlattenArguments<'a, 'b> {
desc: ArgumentDescriptor<(spirv::Word, i32)>,
typ: &ast::Type,
) -> Result<spirv::Word, TranslateError> {
- let mut typ = typ.clone();
let (reg, offset) = desc.op;
- match desc.sema {
- ArgumentSemantics::Default
- | ArgumentSemantics::DefaultRelaxed
- | ArgumentSemantics::PhysicalPointer => {
- if desc.sema == ArgumentSemantics::PhysicalPointer {
- typ = self.id_def.get_typed(reg)?;
- }
- let (width, kind) = match typ {
- ast::Type::Scalar(scalar_t) => {
- let kind = match scalar_t.kind() {
- kind @ ScalarKind::Bit
- | kind @ ScalarKind::Unsigned
- | kind @ ScalarKind::Signed => kind,
- ScalarKind::Float => return Err(TranslateError::MismatchedType),
- ScalarKind::Float2 => return Err(TranslateError::MismatchedType),
- ScalarKind::Pred => return Err(TranslateError::MismatchedType),
- };
- (scalar_t.size_of(), kind)
- }
- _ => return Err(TranslateError::MismatchedType),
- };
- let arith_detail = if kind == ScalarKind::Signed {
- ast::ArithDetails::Signed(ast::ArithSInt {
- typ: ast::SIntType::from_size(width),
- saturate: false,
- })
- } else {
- ast::ArithDetails::Unsigned(ast::UIntType::from_size(width))
- };
- let id_constant_stmt = self.id_def.new_id(typ.clone());
- let result_id = self.id_def.new_id(typ);
- // TODO: check for edge cases around min value/max value/wrapping
- if offset < 0 && kind != ScalarKind::Signed {
+ let add_type;
+ match typ {
+ ast::Type::Pointer(underlying_type, state_space) => {
+ let reg_typ = self.id_def.get_typed(reg)?;
+ if let ast::Type::Pointer(_, _) = reg_typ {
+ let id_constant_stmt = self.id_def.new_id(typ.clone());
self.func.push(Statement::Constant(ConstantDefinition {
dst: id_constant_stmt,
- typ: ast::ScalarType::from_parts(width, kind),
- value: ast::ImmediateValue::U64(-(offset as i64) as u64),
- }));
- self.func.push(Statement::Instruction(
- ast::Instruction::<ExpandedArgParams>::Sub(
- arith_detail,
- ast::Arg3 {
- dst: result_id,
- src1: reg,
- src2: id_constant_stmt,
- },
- ),
- ));
- } else {
- self.func.push(Statement::Constant(ConstantDefinition {
- dst: id_constant_stmt,
- typ: ast::ScalarType::from_parts(width, kind),
+ typ: ast::ScalarType::S64,
value: ast::ImmediateValue::S64(offset as i64),
}));
- self.func.push(Statement::Instruction(
- ast::Instruction::<ExpandedArgParams>::Add(
- arith_detail,
- ast::Arg3 {
- dst: result_id,
- src1: reg,
- src2: id_constant_stmt,
- },
- ),
- ));
+ let dst = self.id_def.new_id(typ.clone());
+ self.func.push(Statement::PtrAdd {
+ underlying_type: underlying_type.clone(),
+ state_space: *state_space,
+ dst,
+ ptr_src: reg,
+ constant_src: id_constant_stmt,
+ });
+ return Ok(dst);
+ } else {
+ add_type = self.id_def.get_typed(reg)?;
}
- Ok(result_id)
}
- ArgumentSemantics::RegisterPointer => {
- if offset == 0 {
- return Ok(reg);
- }
- todo!()
+ _ => {
+ add_type = typ.clone();
}
- ArgumentSemantics::Address => todo!(),
+ };
+ let (width, kind) = match add_type {
+ ast::Type::Scalar(scalar_t) => {
+ let kind = match scalar_t.kind() {
+ kind @ ScalarKind::Bit
+ | kind @ ScalarKind::Unsigned
+ | kind @ ScalarKind::Signed => kind,
+ ScalarKind::Float => return Err(TranslateError::MismatchedType),
+ ScalarKind::Float2 => return Err(TranslateError::MismatchedType),
+ ScalarKind::Pred => return Err(TranslateError::MismatchedType),
+ };
+ (scalar_t.size_of(), kind)
+ }
+ _ => return Err(TranslateError::MismatchedType),
+ };
+ let arith_detail = if kind == ScalarKind::Signed {
+ ast::ArithDetails::Signed(ast::ArithSInt {
+ typ: ast::SIntType::from_size(width),
+ saturate: false,
+ })
+ } else {
+ ast::ArithDetails::Unsigned(ast::UIntType::from_size(width))
+ };
+ let id_constant_stmt = self.id_def.new_id(add_type.clone());
+ let result_id = self.id_def.new_id(add_type);
+ // TODO: check for edge cases around min value/max value/wrapping
+ if offset < 0 && kind != ScalarKind::Signed {
+ self.func.push(Statement::Constant(ConstantDefinition {
+ dst: id_constant_stmt,
+ typ: ast::ScalarType::from_parts(width, kind),
+ value: ast::ImmediateValue::U64(-(offset as i64) as u64),
+ }));
+ self.func.push(Statement::Instruction(
+ ast::Instruction::<ExpandedArgParams>::Sub(
+ arith_detail,
+ ast::Arg3 {
+ dst: result_id,
+ src1: reg,
+ src2: id_constant_stmt,
+ },
+ ),
+ ));
+ } else {
+ self.func.push(Statement::Constant(ConstantDefinition {
+ dst: id_constant_stmt,
+ typ: ast::ScalarType::from_parts(width, kind),
+ value: ast::ImmediateValue::S64(offset as i64),
+ }));
+ self.func.push(Statement::Instruction(
+ ast::Instruction::<ExpandedArgParams>::Add(
+ arith_detail,
+ ast::Arg3 {
+ dst: result_id,
+ src1: reg,
+ src2: id_constant_stmt,
+ },
+ ),
+ ));
}
+ Ok(result_id)
}
fn immediate(
@@ -2281,6 +2428,36 @@ fn insert_implicit_conversions(
should_bitcast_wrapper,
None,
)?,
+ Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst,
+ ptr_src,
+ constant_src,
+ } => {
+ let visit_desc = VisitArgumentDescriptor {
+ desc: ArgumentDescriptor {
+ op: ptr_src,
+ is_dst: false,
+ sema: ArgumentSemantics::PhysicalPointer,
+ },
+ typ: &ast::Type::Pointer(underlying_type.clone(), state_space),
+ stmt_ctor: |new_ptr_src| Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst,
+ ptr_src: new_ptr_src,
+ constant_src,
+ },
+ };
+ insert_implicit_conversions_impl(
+ &mut result,
+ id_def,
+ visit_desc,
+ bitcast_physical_pointer,
+ Some(state_space),
+ )?;
+ }
s @ Statement::Conditional(_)
| s @ Statement::Label(_)
| s @ Statement::Constant(_)
@@ -2327,7 +2504,7 @@ fn insert_implicit_conversions_impl(
conversion_fn = bitcast_physical_pointer;
}
ArgumentSemantics::RegisterPointer => {
- conversion_fn = bitcast_logical_pointer;
+ conversion_fn = bitcast_register_pointer;
}
ArgumentSemantics::Address => {
conversion_fn = force_bitcast_ptr_to_bit;
@@ -2369,26 +2546,18 @@ fn insert_implicit_conversions_impl(
fn get_function_type(
builder: &mut dr::Builder,
map: &mut TypeWordMap,
- method_decl: &ast::MethodDecl<spirv::Word>,
+ spirv_input: &[ast::Variable<ast::Type, spirv::Word>],
+ spirv_output: &[ast::Variable<ast::Type, spirv::Word>],
) -> (spirv::Word, spirv::Word) {
- match method_decl {
- ast::MethodDecl::Func(out_params, _, in_params) => map.get_or_add_fn(
- builder,
- out_params
- .iter()
- .map(|p| SpirvType::from(ast::Type::from(p.v_type.clone()))),
- in_params
- .iter()
- .map(|p| SpirvType::from(ast::Type::from(p.v_type.clone()))),
- ),
- ast::MethodDecl::Kernel { in_args, .. } => map.get_or_add_fn(
- builder,
- iter::empty(),
- in_args
- .iter()
- .map(|p| SpirvType::from(ast::Type::from(p.v_type.clone()))),
- ),
- }
+ map.get_or_add_fn(
+ builder,
+ spirv_input
+ .iter()
+ .map(|var| SpirvType::from(var.v_type.clone())),
+ spirv_output
+ .iter()
+ .map(|var| SpirvType::from(var.v_type.clone())),
+ )
}
fn emit_function_body_ops(
@@ -2416,7 +2585,7 @@ fn emit_function_body_ops(
Statement::Call(call) => {
let (result_type, result_id) = match &*call.ret_params {
[(id, typ)] => (
- map.get_or_add(builder, SpirvType::from(ast::Type::from(typ.clone()))),
+ map.get_or_add(builder, SpirvType::from(typ.to_func_type())),
Some(*id),
),
[] => (map.void(), None),
@@ -2545,42 +2714,13 @@ fn emit_function_body_ops(
}
let result_type =
map.get_or_add(builder, SpirvType::from(ast::Type::from(data.typ.clone())));
- match data.state_space {
- ast::LdStateSpace::Generic
- | ast::LdStateSpace::Global
- | ast::LdStateSpace::Shared => {
- builder.load(result_type, Some(arg.dst), arg.src, None, [])?;
- }
- ast::LdStateSpace::Param | ast::LdStateSpace::Local => {
- let result_type = map.get_or_add(
- builder,
- SpirvType::from(ast::Type::from(data.typ.clone())),
- );
- builder.copy_object(result_type, Some(arg.dst), arg.src)?;
- }
- _ => todo!(),
- }
+ builder.load(result_type, Some(arg.dst), arg.src, None, [])?;
}
ast::Instruction::St(data, arg) => {
if data.qualifier != ast::LdStQualifier::Weak {
todo!()
}
- if data.state_space == ast::StStateSpace::Param
- || data.state_space == ast::StStateSpace::Local
- {
- let result_type = map.get_or_add(
- builder,
- SpirvType::from(ast::Type::from(data.typ.clone())),
- );
- builder.copy_object(result_type, Some(arg.src1), arg.src2)?;
- } else if data.state_space == ast::StStateSpace::Generic
- || data.state_space == ast::StStateSpace::Global
- || data.state_space == ast::StStateSpace::Shared
- {
- builder.store(arg.src1, arg.src2, None, &[])?;
- } else {
- todo!()
- }
+ builder.store(arg.src1, arg.src2, None, &[])?;
}
// SPIR-V does not support ret as guaranteed-converged
ast::Instruction::Ret(_) => builder.ret()?,
@@ -2817,6 +2957,46 @@ fn emit_function_body_ops(
};
negate_func(builder, result_type, Some(arg.dst), arg.src)?;
}
+ ast::Instruction::Sin { arg, .. } => {
+ let result_type = map.get_or_add_scalar(builder, ast::ScalarType::F32);
+ builder.ext_inst(
+ result_type,
+ Some(arg.dst),
+ opencl,
+ spirv::CLOp::sin as u32,
+ [arg.src],
+ )?;
+ }
+ ast::Instruction::Cos { arg, .. } => {
+ let result_type = map.get_or_add_scalar(builder, ast::ScalarType::F32);
+ builder.ext_inst(
+ result_type,
+ Some(arg.dst),
+ opencl,
+ spirv::CLOp::cos as u32,
+ [arg.src],
+ )?;
+ }
+ ast::Instruction::Lg2 { arg, .. } => {
+ let result_type = map.get_or_add_scalar(builder, ast::ScalarType::F32);
+ builder.ext_inst(
+ result_type,
+ Some(arg.dst),
+ opencl,
+ spirv::CLOp::log2 as u32,
+ [arg.src],
+ )?;
+ }
+ ast::Instruction::Ex2 { arg, .. } => {
+ let result_type = map.get_or_add_scalar(builder, ast::ScalarType::F32);
+ builder.ext_inst(
+ result_type,
+ Some(arg.dst),
+ opencl,
+ spirv::CLOp::exp2 as u32,
+ [arg.src],
+ )?;
+ }
},
Statement::LoadVar(arg, typ) => {
let type_id = map.get_or_add(builder, SpirvType::from(typ.clone()));
@@ -2842,6 +3022,22 @@ fn emit_function_body_ops(
let result_type = map.get_or_add(builder, SpirvType::from(t.clone()));
builder.undef(result_type, Some(*id));
}
+ Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst,
+ ptr_src,
+ constant_src,
+ } => {
+ let s64_type = map.get_or_add_scalar(builder, ast::ScalarType::S64);
+ let ptr_as_s64 = builder.bitcast(s64_type, None, *ptr_src)?;
+ let added_ptr = builder.i_add(s64_type, None, ptr_as_s64, *constant_src)?;
+ let result_type = map.get_or_add(
+ builder,
+ SpirvType::from(ast::Type::Pointer(underlying_type.clone(), *state_space)),
+ );
+ builder.bitcast(result_type, Some(*dst), added_ptr)?;
+ }
}
}
Ok(())
@@ -3722,16 +3918,21 @@ fn expand_map_variables<'a, 'b>(
ast::Statement::Variable(var) => {
let ss = match var.var.v_type {
ast::VariableType::Reg(_) => StateSpace::Reg,
- ast::VariableType::Local(_) => StateSpace::Local,
- ast::VariableType::Param(_) => StateSpace::ParamReg,
ast::VariableType::Global(_) => StateSpace::Global,
ast::VariableType::Shared(_) => StateSpace::Shared,
+ ast::VariableType::Param(_) => StateSpace::ParamReg,
+ ast::VariableType::Local(_) => StateSpace::Local,
+ };
+ let mut var_type = ast::Type::from(var.var.v_type.clone());
+ var_type = match var.var.v_type {
+ ast::VariableType::Reg(_) | ast::VariableType::Shared(_) => var_type,
+ ast::VariableType::Global(_) => var_type.pointer_to(ast::LdStateSpace::Global)?,
+ ast::VariableType::Param(_) => var_type.pointer_to(ast::LdStateSpace::Param)?,
+ ast::VariableType::Local(_) => var_type.pointer_to(ast::LdStateSpace::Local)?,
};
match var.count {
Some(count) => {
- for new_id in
- id_defs.add_defs(var.var.name, count, ss, var.var.v_type.clone().into())
- {
+ for new_id in id_defs.add_defs(var.var.name, count, ss, var_type) {
result.push(Statement::Variable(ast::Variable {
align: var.var.align,
v_type: var.var.v_type.clone(),
@@ -3741,8 +3942,7 @@ fn expand_map_variables<'a, 'b>(
}
}
None => {
- let new_id =
- id_defs.add_def(var.var.name, Some((ss, var.var.v_type.clone().into())));
+ let new_id = id_defs.add_def(var.var.name, Some((ss, var_type)));
result.push(Statement::Variable(ast::Variable {
align: var.var.align,
v_type: var.var.v_type.clone(),
@@ -3858,11 +4058,14 @@ impl<'a> GlobalStringIdResolver<'a> {
fn start_fn<'b>(
&'b mut self,
header: &'b ast::MethodDecl<'a, &'a str>,
- ) -> (
- FnStringIdResolver<'a, 'b>,
- GlobalFnDeclResolver<'a, 'b>,
- ast::MethodDecl<'a, spirv::Word>,
- ) {
+ ) -> Result<
+ (
+ FnStringIdResolver<'a, 'b>,
+ GlobalFnDeclResolver<'a, 'b>,
+ ast::MethodDecl<'a, spirv::Word>,
+ ),
+ TranslateError,
+ > {
// In case a function decl was inserted earlier we want to use its id
let name_id = self.get_or_add_def(header.name());
let mut fn_resolver = FnStringIdResolver {
@@ -3874,18 +4077,13 @@ impl<'a> GlobalStringIdResolver<'a> {
type_check: HashMap::new(),
};
let new_fn_decl = match header {
- ast::MethodDecl::Kernel {
- name,
- in_args,
- uses_shared_mem,
- } => ast::MethodDecl::Kernel {
+ ast::MethodDecl::Kernel { name, in_args } => ast::MethodDecl::Kernel {
name,
- in_args: expand_kernel_params(&mut fn_resolver, in_args.iter()),
- uses_shared_mem: *uses_shared_mem,
+ in_args: expand_kernel_params(&mut fn_resolver, in_args.iter())?,
},
ast::MethodDecl::Func(ret_params, _, params) => {
- let ret_params_ids = expand_fn_params(&mut fn_resolver, ret_params.iter());
- let params_ids = expand_fn_params(&mut fn_resolver, params.iter());
+ let ret_params_ids = expand_fn_params(&mut fn_resolver, ret_params.iter())?;
+ let params_ids = expand_fn_params(&mut fn_resolver, params.iter())?;
self.fns.insert(
name_id,
FnDecl {
@@ -3896,14 +4094,14 @@ impl<'a> GlobalStringIdResolver<'a> {
ast::MethodDecl::Func(ret_params_ids, name_id, params_ids)
}
};
- (
+ Ok((
fn_resolver,
GlobalFnDeclResolver {
variables: &self.variables,
fns: &self.fns,
},
new_fn_decl,
- )
+ ))
}
}
@@ -4080,6 +4278,13 @@ enum Statement<I, P: ast::ArgParams> {
Constant(ConstantDefinition),
RetValue(ast::RetData, spirv::Word),
Undef(ast::Type, spirv::Word),
+ PtrAdd {
+ underlying_type: ast::PointerType,
+ state_space: ast::LdStateSpace,
+ dst: spirv::Word,
+ ptr_src: spirv::Word,
+ constant_src: spirv::Word,
+ },
}
impl ExpandedStatement {
@@ -4141,6 +4346,24 @@ impl ExpandedStatement {
let id = f(id);
Statement::Undef(typ, id)
}
+ Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst,
+ ptr_src,
+ constant_src,
+ } => {
+ let dst = f(dst);
+ let ptr_src = f(ptr_src);
+ let constant_src = f(constant_src);
+ Statement::PtrAdd {
+ underlying_type,
+ state_space,
+ dst,
+ ptr_src,
+ constant_src,
+ }
+ }
}
}
}
@@ -4175,10 +4398,10 @@ impl<From: ArgParamsEx<Id = spirv::Word>> ResolvedCall<From> {
let new_id = visitor.id(
ArgumentDescriptor {
op: id,
- is_dst: true,
- sema: ArgumentSemantics::Default,
+ is_dst: !typ.is_param(),
+ sema: typ.semantics(),
},
- Some(&typ.clone().into()),
+ Some(&typ.to_func_type()),
)?;
Ok((new_id, typ))
})
@@ -4199,9 +4422,9 @@ impl<From: ArgParamsEx<Id = spirv::Word>> ResolvedCall<From> {
ArgumentDescriptor {
op: id,
is_dst: false,
- sema: ArgumentSemantics::Default,
+ sema: typ.semantics(),
},
- &typ.clone().into(),
+ &typ.to_func_type(),
)?;
Ok((new_id, typ))
})
@@ -4364,6 +4587,7 @@ enum Directive<'input> {
struct Function<'input> {
pub func_decl: ast::MethodDecl<'input, spirv::Word>,
+ pub spirv_decl: SpirvMethodDecl<'input>,
pub globals: Vec<ast::Variable<ast::VariableType, spirv::Word>>,
pub body: Option<Vec<ExpandedStatement>>,
import_as: Option<String>,
@@ -4574,9 +4798,7 @@ impl<T: ArgParamsEx> ast::Instruction<T> {
// Call instruction is converted to a call statement early on
ast::Instruction::Call(_) => return Err(TranslateError::Unreachable),
ast::Instruction::Ld(d, a) => {
- let is_param = d.state_space == ast::LdStateSpace::Param
- || d.state_space == ast::LdStateSpace::Local;
- let new_args = a.map(visitor, &d, is_param)?;
+ let new_args = a.map(visitor, &d)?;
ast::Instruction::Ld(d, new_args)
}
ast::Instruction::Mov(d, a) => {
@@ -4629,9 +4851,7 @@ impl<T: ArgParamsEx> ast::Instruction<T> {
ast::Instruction::Shr(t, a.map_shift(visitor, &ast::Type::Scalar(t.into()))?)
}
ast::Instruction::St(d, a) => {
- let is_param = d.state_space == ast::StStateSpace::Param
- || d.state_space == ast::StStateSpace::Local;
- let new_args = a.map(visitor, &d, is_param)?;
+ let new_args = a.map(visitor, &d)?;
ast::Instruction::St(d, new_args)
}
ast::Instruction::Bra(d, a) => ast::Instruction::Bra(d, a.map(visitor, None)?),
@@ -4693,6 +4913,34 @@ impl<T: ArgParamsEx> ast::Instruction<T> {
ast::Instruction::Neg(d, a) => {
ast::Instruction::Neg(d, a.map(visitor, &ast::Type::Scalar(d.typ))?)
}
+ ast::Instruction::Sin { flush_to_zero, arg } => {
+ let typ = ast::Type::Scalar(ast::ScalarType::F32);
+ ast::Instruction::Sin {
+ flush_to_zero,
+ arg: arg.map(visitor, &typ)?,
+ }
+ }
+ ast::Instruction::Cos { flush_to_zero, arg } => {
+ let typ = ast::Type::Scalar(ast::ScalarType::F32);
+ ast::Instruction::Cos {
+ flush_to_zero,
+ arg: arg.map(visitor, &typ)?,
+ }
+ }
+ ast::Instruction::Lg2 { flush_to_zero, arg } => {
+ let typ = ast::Type::Scalar(ast::ScalarType::F32);
+ ast::Instruction::Lg2 {
+ flush_to_zero,
+ arg: arg.map(visitor, &typ)?,
+ }
+ }
+ ast::Instruction::Ex2 { flush_to_zero, arg } => {
+ let typ = ast::Type::Scalar(ast::ScalarType::F32);
+ ast::Instruction::Ex2 {
+ flush_to_zero,
+ arg: arg.map(visitor, &typ)?,
+ }
+ }
})
}
}
@@ -4864,6 +5112,24 @@ impl ast::Type {
components: vec![*len as u32],
state_space: *state_space,
},
+ ast::Type::Pointer(ast::PointerType::Array(scalar, components), state_space) => {
+ TypeParts {
+ kind: TypeKind::PointerArray,
+ scalar_kind: scalar.kind(),
+ width: scalar.size_of(),
+ components: components.clone(),
+ state_space: *state_space,
+ }
+ }
+ ast::Type::Pointer(ast::PointerType::Pointer(scalar, inner_space), state_space) => {
+ TypeParts {
+ kind: TypeKind::PointerPointer,
+ scalar_kind: scalar.kind(),
+ width: scalar.size_of(),
+ components: vec![*inner_space as u32],
+ state_space: *state_space,
+ }
+ }
}
}
@@ -4891,6 +5157,31 @@ impl ast::Type {
),
t.state_space,
),
+ TypeKind::PointerArray => ast::Type::Pointer(
+ ast::PointerType::Array(
+ ast::ScalarType::from_parts(t.width, t.scalar_kind),
+ t.components,
+ ),
+ t.state_space,
+ ),
+ TypeKind::PointerPointer => ast::Type::Pointer(
+ ast::PointerType::Pointer(
+ ast::ScalarType::from_parts(t.width, t.scalar_kind),
+ unsafe { mem::transmute::<_, ast::LdStateSpace>(t.components[0] as u8) },
+ ),
+ t.state_space,
+ ),
+ }
+ }
+
+ fn size_of(&self) -> usize {
+ match self {
+ ast::Type::Scalar(typ) => typ.size_of() as usize,
+ ast::Type::Vector(typ, len) => (typ.size_of() as usize) * (*len as usize),
+ ast::Type::Array(typ, len) => len
+ .iter()
+ .fold(typ.size_of() as usize, |x, y| (x as usize) * (*y as usize)),
+ ast::Type::Pointer(_, _) => mem::size_of::<usize>(),
}
}
}
@@ -4911,6 +5202,8 @@ enum TypeKind {
Array,
PointerScalar,
PointerVector,
+ PointerArray,
+ PointerPointer,
}
impl ast::Instruction<ExpandedArgParams> {
@@ -5002,6 +5295,12 @@ impl ast::Instruction<ExpandedArgParams> {
ast::Instruction::Neg(details, _) => details
.flush_to_zero
.map(|ftz| (ftz, details.typ.size_of())),
+ ast::Instruction::Sin { flush_to_zero, .. }
+ | ast::Instruction::Cos { flush_to_zero, .. }
+ | ast::Instruction::Lg2 { flush_to_zero, .. }
+ | ast::Instruction::Ex2 { flush_to_zero, .. } => {
+ Some((*flush_to_zero, mem::size_of::<f32>() as u8))
+ }
}
}
}
@@ -5139,28 +5438,6 @@ impl<'a> ast::Instruction<ast::ParsedArgParams<'a>> {
}
}
-impl ast::VariableParamType {
- fn width(&self) -> usize {
- match self {
- ast::VariableParamType::Scalar(t) => ast::ScalarType::from(*t).size_of() as usize,
- ast::VariableParamType::Array(t, len) => {
- (ast::ScalarType::from(*t).size_of() as usize)
- * (len.iter().fold(1, |x, y| x * (*y)) as usize)
- }
- ast::VariableParamType::Pointer(_, _) => mem::size_of::<usize>(),
- }
- }
-}
-
-impl ast::KernelArgumentType {
- fn width(&self) -> usize {
- match self {
- ast::KernelArgumentType::Normal(t) => t.width(),
- ast::KernelArgumentType::Shared => mem::size_of::<usize>(),
- }
- }
-}
-
impl From<ast::KernelArgumentType> for ast::Type {
fn from(this: ast::KernelArgumentType) -> Self {
match this {
@@ -5173,18 +5450,6 @@ impl From<ast::KernelArgumentType> for ast::Type {
}
}
-impl ast::KernelArgumentType {
- fn to_param(self) -> ast::VariableParamType {
- match self {
- ast::KernelArgumentType::Normal(p) => p,
- ast::KernelArgumentType::Shared => ast::VariableParamType::Pointer(
- ast::SizedScalarType::B8,
- ast::PointerStateSpace::Shared,
- ),
- }
- }
-}
-
impl<T: ArgParamsEx> ast::Arg1<T> {
fn cast<U: ArgParamsEx<Id = T::Id>>(self) -> ast::Arg1<U> {
ast::Arg1 { src: self.src }
@@ -5303,7 +5568,6 @@ impl<T: ArgParamsEx> ast::Arg2Ld<T> {
self,
visitor: &mut V,
details: &ast::LdDetails,
- is_param: bool,
) -> Result<ast::Arg2Ld<U>, TranslateError> {
let dst = visitor.id_or_vector(
ArgumentDescriptor {
@@ -5313,24 +5577,22 @@ impl<T: ArgParamsEx> ast::Arg2Ld<T> {
},
&ast::Type::from(details.typ.clone()),
)?;
+ let is_logical_ptr = details.state_space == ast::LdStateSpace::Param
+ || details.state_space == ast::LdStateSpace::Local;
let src = visitor.operand(
ArgumentDescriptor {
op: self.src,
is_dst: false,
- sema: if is_param {
+ sema: if is_logical_ptr {
ArgumentSemantics::RegisterPointer
} else {
ArgumentSemantics::PhysicalPointer
},
},
- &(if is_param {
- ast::Type::from(details.typ.clone())
- } else {
- ast::Type::Pointer(
- ast::PointerType::from(details.typ.clone()),
- details.state_space,
- )
- }),
+ &ast::Type::Pointer(
+ ast::PointerType::from(details.typ.clone()),
+ details.state_space,
+ ),
)?;
Ok(ast::Arg2Ld { dst, src })
}
@@ -5350,26 +5612,23 @@ impl<T: ArgParamsEx> ast::Arg2St<T> {
self,
visitor: &mut V,
details: &ast::StData,
- is_param: bool,
) -> Result<ast::Arg2St<U>, TranslateError> {
+ let is_logical_ptr = details.state_space == ast::StStateSpace::Param
+ || details.state_space == ast::StStateSpace::Local;
let src1 = visitor.operand(
ArgumentDescriptor {
op: self.src1,
- is_dst: is_param,
- sema: if is_param {
+ is_dst: false,
+ sema: if is_logical_ptr {
ArgumentSemantics::RegisterPointer
} else {
ArgumentSemantics::PhysicalPointer
},
},
- &(if is_param {
- details.typ.clone().into()
- } else {
- ast::Type::Pointer(
- ast::PointerType::from(details.typ.clone()),
- details.state_space.to_ld_ss(),
- )
- }),
+ &ast::Type::Pointer(
+ ast::PointerType::from(details.typ.clone()),
+ details.state_space.to_ld_ss(),
+ ),
)?;
let src2 = visitor.operand_or_vector(
ArgumentDescriptor {
@@ -6190,7 +6449,7 @@ impl ast::LdStateSpace {
ast::LdStateSpace::Global => spirv::StorageClass::CrossWorkgroup,
ast::LdStateSpace::Local => spirv::StorageClass::Function,
ast::LdStateSpace::Shared => spirv::StorageClass::Workgroup,
- ast::LdStateSpace::Param => unreachable!(),
+ ast::LdStateSpace::Param => spirv::StorageClass::Function,
}
}
}
@@ -6264,18 +6523,24 @@ impl ast::AtomSemantics {
}
}
-fn bitcast_logical_pointer(
- operand: &ast::Type,
- instr: &ast::Type,
- _: Option<ast::LdStateSpace>,
-) -> Result<Option<ConversionKind>, TranslateError> {
- if instr != operand {
- Ok(Some(ConversionKind::Default))
- } else {
- Ok(None)
+impl ast::FnArgumentType {
+ fn semantics(&self) -> ArgumentSemantics {
+ match self {
+ ast::FnArgumentType::Reg(_) => ArgumentSemantics::Default,
+ ast::FnArgumentType::Param(_) => ArgumentSemantics::RegisterPointer,
+ ast::FnArgumentType::Shared => ArgumentSemantics::PhysicalPointer,
+ }
}
}
+fn bitcast_register_pointer(
+ operand_type: &ast::Type,
+ instr_type: &ast::Type,
+ ss: Option<ast::LdStateSpace>,
+) -> Result<Option<ConversionKind>, TranslateError> {
+ bitcast_physical_pointer(operand_type, instr_type, ss)
+}
+
fn bitcast_physical_pointer(
operand_type: &ast::Type,
instr_type: &ast::Type,
@@ -6315,13 +6580,15 @@ fn bitcast_physical_pointer(
}
ast::Type::Scalar(ast::ScalarType::B32)
| ast::Type::Scalar(ast::ScalarType::U32)
- | ast::Type::Scalar(ast::ScalarType::S32) => {
- if let Some(ast::LdStateSpace::Shared) = ss {
+ | ast::Type::Scalar(ast::ScalarType::S32) => match ss {
+ Some(ast::LdStateSpace::Shared)
+ | Some(ast::LdStateSpace::Generic)
+ | Some(ast::LdStateSpace::Param)
+ | Some(ast::LdStateSpace::Local) => {
Ok(Some(ConversionKind::BitToPtr(ast::LdStateSpace::Shared)))
- } else {
- Err(TranslateError::MismatchedType)
}
- }
+ _ => Err(TranslateError::MismatchedType),
+ },
ast::Type::Pointer(op_scalar_t, op_space) => {
if let ast::Type::Pointer(instr_scalar_t, instr_space) = instr_type {
if op_space == instr_space {
@@ -6566,21 +6833,68 @@ impl<'a> ast::MethodDecl<'a, &'a str> {
}
}
-impl<'a> ast::MethodDecl<'a, spirv::Word> {
- fn visit_args(&self, f: &mut impl FnMut(&ast::FnArgument<spirv::Word>)) {
- match self {
- ast::MethodDecl::Func(_, _, params) => params.iter().for_each(f),
- ast::MethodDecl::Kernel { in_args, .. } => in_args.iter().for_each(|arg| {
- f(&ast::FnArgument {
- align: arg.align,
- name: arg.name,
- v_type: match arg.v_type.clone() {
- ast::KernelArgumentType::Normal(typ) => ast::FnArgumentType::Param(typ),
- ast::KernelArgumentType::Shared => ast::FnArgumentType::Shared,
- },
- array_init: arg.array_init.clone(),
- })
- }),
+struct SpirvMethodDecl<'input> {
+ input: Vec<ast::Variable<ast::Type, spirv::Word>>,
+ output: Vec<ast::Variable<ast::Type, spirv::Word>>,
+ name: MethodName<'input>,
+ uses_shared_mem: bool,
+}
+
+impl<'input> SpirvMethodDecl<'input> {
+ fn new(ast_decl: &ast::MethodDecl<'input, spirv::Word>) -> Self {
+ let (input, output) = match ast_decl {
+ ast::MethodDecl::Kernel { in_args, .. } => {
+ let spirv_input = in_args
+ .iter()
+ .map(|var| {
+ let v_type = match &var.v_type {
+ ast::KernelArgumentType::Normal(t) => {
+ ast::FnArgumentType::Param(t.clone())
+ }
+ ast::KernelArgumentType::Shared => ast::FnArgumentType::Shared,
+ };
+ ast::Variable {
+ name: var.name,
+ align: var.align,
+ v_type: v_type.to_kernel_type(),
+ array_init: var.array_init.clone(),
+ }
+ })
+ .collect();
+ (spirv_input, Vec::new())
+ }
+ ast::MethodDecl::Func(out_args, _, in_args) => {
+ let (param_output, non_param_output): (Vec<_>, Vec<_>) =
+ out_args.iter().partition(|var| var.v_type.is_param());
+ let spirv_output = non_param_output
+ .into_iter()
+ .cloned()
+ .map(|var| ast::Variable {
+ name: var.name,
+ align: var.align,
+ v_type: var.v_type.to_func_type(),
+ array_init: var.array_init.clone(),
+ })
+ .collect();
+ let spirv_input = param_output
+ .into_iter()
+ .cloned()
+ .chain(in_args.iter().cloned())
+ .map(|var| ast::Variable {
+ name: var.name,
+ align: var.align,
+ v_type: var.v_type.to_func_type(),
+ array_init: var.array_init.clone(),
+ })
+ .collect();
+ (spirv_input, spirv_output)
+ }
+ };
+ SpirvMethodDecl {
+ input,
+ output,
+ name: MethodName::new(ast_decl),
+ uses_shared_mem: false,
}
}
}