fix ifu gemm perf regression (#348)

This commit is contained in:
Shucai Xiao
2023-10-04 08:45:18 -05:00
committed by GitHub
parent e6f75d05e3
commit 8049891ff7

View File

@@ -419,6 +419,13 @@ SmallVector<Value> LayoutPropagation::propagateToUsers(Value value,
user->hasTrait<mlir::OpTrait::Elementwise>() ||
isa<triton::ReduceOp, triton::ExpandDimsOp,
triton::gpu::ConvertLayoutOp>(user)) {
#ifdef USE_ROCM
if (auto convertOp = dyn_cast<triton::gpu::ConvertLayoutOp>(user)) {
if (triton::gpu::isSharedEncoding(convertOp.getResult()) ||
triton::gpu::isSharedEncoding(convertOp.getOperand()))
continue;
}
#endif
setEncoding(user->getResults(), info, changed, user);
continue;
}