1 | #pragma once |
---|---|
2 | |
3 | #include <kernel_ir.h> |
4 | |
5 | namespace torch { |
6 | namespace jit { |
7 | namespace fuser { |
8 | namespace cuda { |
9 | |
10 | struct WarpPaddedParallelInfo { |
11 | bool is_tidx_padded = false; |
12 | bool is_tidx_single_warp = false; |
13 | bool has_warp_reduction = false; |
14 | }; |
15 | |
16 | std::vector<Expr*> fuseWarpReduce(const std::vector<Expr*> exprs); |
17 | |
18 | } // namespace cuda |
19 | } // namespace fuser |
20 | } // namespace jit |
21 | } // namespace torch |
22 |